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进入 21 世纪 以 来 ， 整 个 社会 已 经 逐渐 变 得 陌生 了 ! 生活 和 工作 的 快 节 奏 令 我 们 目 不 暇 
接 ， 各 种 各 样 的 信息 充斥 着 我 们 的 视野 、 撞 击 着 我 们 的 思维 。 追 忆 过 去 ，Windows RER 
统 的 诞生 成 就 了 微软 公司 的 霸主 地 位 , 也 造就 了 PC 时 代 的 繁荣 , 然而 , 以 Android 和 iPhone 
手机 为 代表 的 智能 移动 设备 的 发 明 却 敲 响 了 PCH RAR! 移动 互联 网 时 代 已 经 来 临 ， 谁 
会 成 为 这 些 移动 设备 上 的 主宰 ? 毫 无 疑问 ， 它 就 是 Android 一 一 PC 时 代 的 Windows! 


3G 的 璀璨 绚丽 


随 着 3G 的 到 来 ， 无 线 带宽 越 来 越 高 ， 使 更 多 内 容 丰 富 的 应 用 程序 布置 在 手机 上 成 为 可 
能 ， 如 视频 通话 、 视 频 点 播 、 移 动 互联 网 冲浪 、 在 线 看 书 / 听 歌 、 内 容 分 享 等 。 为 了 承载 这 
些 数据 应 用 及 快速 部 署 ， 手 机 的 功能 将 会 越 来 越 知 能 ， 越 来 越 开 放 ， 为 了 实现 这 些 需求 ， 
必须 有 一 个 良好 的 开发 平台 来 支持 ， 在 此 由 Google 公司 发 起 的 OHA 联盟 走 在 了 业界 的 前 
列 ，2007 年 11 月 推出 了 开放 的 Android 平台 ， 任 何 公司 及 个 人 都 可 以 免费 获取 到 源 代码 及 
开发 SDK。 由 于 其 开放 性 和 优异 性 ，Android 平台 得 到 了 业界 广泛 的 支持 ， 其 中 包括 各 大 手 
机 厂商 和 著名 的 移动 运营 商 等 . AE 2008 年 9 月 第 一 款 基 于 Android 平台 的 手机 G1 发 布 后 ， 
预计 三 星 、 摩 托 罗拉 、 索 爱 、LG、 华 为 等 公司 都 将 推出 Gflg-Android 平台 的 手机 ， 中 国 
移动 也 将 联合 各 手机 厂商 共同 推出 基于 Android 平台 的 OPhone。 按 目前 的 发 展 态势 ， 我 们 
有 理由 相信 ，Android 平台 能 够 在 短 时间 内 跻身 智能 手机 开发 平台 的 前 列 。 

自从 公元 2009 年 3G 牌照 在 国内 发 放 后 ，3G、Android、iPhone、Google、 苹 果 、 手 机 
软件 、 移 动 开发 等 词 越 来 越 充斥 于 耳 。 随 着 3G 网 络 的 大 规模 建设 和 智能 手机 的 迅速 普及 ， 
移动 互联 网 时 代 已 经 微笑 着 迎面 而 来 。 ; 

作为 以 创新 的 搜索 引擎 技术 而 一 跃 成 为 互联 网 巨头 的 
军 移动 互联 网 的 一 块 基石 。Android 操作 
公司 以 其 天 才 的 创新 ， 


Ps rsa Android EH -+ 


机 制造 商 ， 现 在 三 星 借助 Android 这 个 东风 ， 已 经 成 为 世界 上 发 货 量 最 大 的 手机 制造 商 。 
巨大 的 优势 


从 技术 角度 而 言 ，Android 5 iPhone 相似 ， 采 用 WebKit 浏览 器 引擎 ， 具 备 触摸 屏 、 高 
级 图 形 显示 和 上 网 功能 ， 用 户 能 够 在 手机 上 查收 电子 邮件 、 搜 索 网 址 和 观看 视频 节目 等 。 
Android 手机 比 iPhone 等 其 他 手机 更 强调 搜索 功能 , 界面 更 强大 , 可 以 说 是 一 种 融入 了 全 部 Web 
应 用 的 开发 平台 。 Android 的 版 本 包括 Android 1.1. Android 1.5. Android 1.6. Android 2.0……- 
当前 的 最 新 版 本 是 Android 4.2。 随 着 版 本 的 更 新 ， 从 最 初 的 触 屏 到 现在 的 多 点 触摸 ， 从 普 
通 的 联系 人 到 现在 的 数据 同步 ， 从 简单 的 GoogleMap 到 现在 的 导航 系统 ， 从 基本 的 网 页 浏 
览 到 现在 的 HTML 5, 这 都 说 明 Android 已 经 逐渐 稳定 , 而 且 功 能 越 来 越 强 大 . 此 外 , Android 
平台 不 仅 支持 Java、C、C++ 等 主流 的 编程 语言 ， 还 支持 Ruby、Python 等 脚本 语言 ， 甚 至 
Google 公司 专 为 Android 的 应 用 开发 推出 了 Simple 语言 ， 这 使 得 Android 有 着 非常 广泛 的 
开发 群体 。 


本 书 的 内 容 


本 书 循序 渐进 地 详细 讲解 了 Android 虚拟 机 技术 的 基本 知识 ， 内 容 新 颖 、 知 识 全 面 、 讲 
解 详细 ， 全 书 共 分 13 章 。Android 虚拟 机 技术 博大 精深 ， 需 要 程序 员 具 备 极 高 的 水 准 和 开 
发 经 验 。 笔 者 从 事 Android 开发 也 是 短 短 数 载 ， 也 不 可 能 完全 掌握 Android 优化 技术 。 本 书 
尽 可 能 地 将 Android 虚拟 机 技术 的 核心 内 容 展 现 给 读者 ， 本 书 主要 讲解 了 如 下 所 示 的 核心 
WA. 

Android 系统 框架 结构 。 

Java 虚拟 机 和 Dalvik 虚拟 机 原理 。 
程序 编译 和 调试 。 

Dalvik 的 运作 流程 和 核心 机 制 。 
DEX 优化 技术 。 
安全 管理 的 基本 知识 
Android 虚拟 机 生命 周期 管理 。 
虚拟 机 内 存 分 配 策略 。 

虚拟 机 的 垃圾 收集 机 制 。 
线程 管理 机 制 和 框架 。 

JNI 层 的 原理 和 核心 理念 。 

JIT 编译 的 基本 过 程 。 

科学 的 学 习 方法 

不 要 认为 学 习 Android 技术 是 一 件 很 困难 的 事情 ， 不 断 寻找 规律 ， 学 习 新 知识 和 新 技 
能 ， 积 累 经 验 ， 这 几乎 是 每 一 个 电脑 高 手 的 成 长 之 路 。 中 国有 各 古 话 : “ 授 人 以 鱼 ， 不 如 
授 人 以 渔 ”， 说 的 是 传授 给 人 既 有 知识 ， 不 如 传授 给 人 学 习 知 识 的 方法 。 通 过 本 书 ， 我 们 
将 告诉 读者 学 习 的 方法 ， 并 介绍 一 条 比较 清晰 的 学 习 之 路 。 

(1) 积极 的 心态 

无 论 是 知识 还 是 技能 ， 智 者 之 所 以 能 够 更 好 更 快 地 掌握 这 些 知识 和 技能 ， 在 很 大 程度 
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上 得 益 于 良好 的 学 习 方 法 。 人 们 常 说 : 兴趣 是 最 好 的 老师 ， 压 力 是 前 进 的 动力 ， 要 想 获得 
一 个 积极 的 心态 ， 最 好 能 对 学 习 对 象 保持 浓厚 的 兴趣 。 如 果 暂 时 提 不 起 兴趣 ， 那 么 就 重视 
来 自 工作 或 生活 的 压力 ， 把 它们 转 为 化 为 学 习 的 动力 。 

(2) 注重 实践 

读者 在 学 习 本 书 的 过 程 中 ， 建 议 学 完 理论 后 ， 进 行 实际 操作 。 首 先 学 习 书 中 的 理论 ， 
再 动手 调试 本 书 中 的 实例 ， 然 后 用 模拟 器 运行 书 中 的 例子 ， 只 有 这 样 才能 做 到 印象 深刻 ， 
才能 真正 理解 Android 网 络 的 基本 知识 。 这 样 当 在 实际 应 用 中 遇 到 其 他 类 似 问题 时 ， 才 能 做 
到 熟 能 生 巧 、 触 类 旁 通 。 

(3) 善 用 资源 ， 学 以 致 用 

对 于 计算 机 网 络 技术 ， 除 了 少 部 分 专业 人 士 外 ， 大 部 分 人 学 习 网 络 的 目的 是 为 了 应 用 ， 
通过 网 络 解决 工作 中 的 问题 并 提高 工作 效率 。“ 解 决 问题 ”常常 是 促使 人 学 习 的 一 大 动机 ， 
带 着 问题 学 习 ， 不 但 进步 快 ， 而 且 很 容易 对 网 络 产生 更 大 的 兴趣 ， 从 而 获得 持续 的 进步。 


本 书 特色 


本 书 的 内 容 相当 丰富 ,内 容 覆 盖 全 面 , 满足 了 Android 虚拟 机 技术 人 员 成 长 道路 上 的 方 
方面 面 。 我 们 的 目标 是 通过 一 本 图 书 ， 提 供 多 本 图 书 的 价值 ， 读 者 可 以 根据 自己 的 需要 有 
选择 地 阅读 ， 以 完善 本 人 的 知识 和 技能 结构 。 在 内 容 的 编写 上 ， 本 书 具 有 以 下 特色 。 

(1) 结构 合理 

从 用 户 的 实际 需要 出 发 ， 科 学 安排 知识 结构 ， 内 容 由 浅 入 深 ， 氢 述 清 楚 ， 并 附 有 相应 
的 总 结 和 练习 ， 具 有 很 强 的 知识 性 和 实用 性 , 反映 了 当前 Android 虚拟 机 技术 的 发 展 和 应 用 
水 平 。 同 时 全 书 精 心 筛选 的 最 具 代 表 性 、 读 者 最 关心 的 知识 点 ， 几 乎 包括 Android 虚拟 机 技 
术 的 所 有 方面 。 

(2) 易学 易 懂 

本 书 条 理 清 晰 、 语 言 简洁 ， 可 帮助 读者 快速 掌握 每 个 知识 点 ; 每 个 部 分 既 相 互 连 贯 又 
自 成 体系 ， 使 读者 既 可 以 按照 本 书 编排 的 章节 顺序 进行 学 习 ， 也 可 以 根据 自己 的 需求 对 某 
一 章节 进行 有 针对 性 的 学 习 。 

(3) 实用 性 强 

本 书 彻底 握 弃 枯燥 的 理论 和 简单 的 操作 ,注重 实用 性 和 可 操作 性 ， 本 书 将 Android 虚拟 
机 技术 的 理论 融合 到 实际 的 操作 环境 中 ， 使 用 户 掌握 相关 的 操作 技能 的 同时 ， 还 能 学 习 到 
相应 的 开发 知识 。 


本 书 的 读者 对 象 


本 书 在 内 容 安排 上 由 浅 入 深 ， 在 写作 上 运用 剥 洋 葱 式 的 分 解 ， 非 常 适合 于 入 门 Android 
开发 技术 的 初学 者 ， 同 时 也 适合 于 具有 一 定 Android 开发 基础 ， 想 对 Android 开发 技术 进 一 
步 了 解 和 掌握 的 中 级 学 者 。 如 果 你 是 以 下 类 型 的 学 者 ， 此 书 会 带领 你 迅速 进入 Android 的 开 
发 领域 。 

@ 有 一 定 Android 开发 经 验 的 读者 。 

从 事 Android 开发 的 研究 人 员 和 工作 人 员 。 
有 一 定 Android 开发 基础 ， 想 快速 学 会 Android 高 级 技术 的 读者 。 
有 一 定 Android 开发 开发 基础 ， 需 要 加 深 对 Android 技术 核心 进一步 了 解 和 掌握 
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的 程序 员 。 
e ”高 等 院 校 相关 专业 的 学 生 ， 或 需要 编写 论文 的 学 生 。 
e 企业 和 公司 在 职 人 员 、 需 要 提高 学 习 或 工作 需要 的 程序 员 。 
© ”从 事 Android 移动 网 络 开发 等 相关 工作 的 技术 人 员 。 
在 本 书 的 写作 过 程 中 得 到 了 清华 大 学 出 版 社工 作 人 员 的 大 力 支 持 ， 在 此 特意 感谢 各 位 
编辑 老师 们 的 指点 和 付出 的 汗水 。 另 外 ， 笔 者 毕竟 水 平 有 限 ， 书 中 兹 漏 和 不 尽 如 人 意 之 处 
在 所 难免 ， 诚 请 读者 提出 意见 或 建议 ， 以 便 修 订 并 使 之 更 至 完善 。 
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Android 系统 介绍 .1 
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1.1.1 什么 是 智能 手机 
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Android ff) EKR n... 
在 电脑 上 启动 Android 虚拟 机 
1.3.1 安装 Android SDK... 
1.3.2 安装 JDK, Eclipse, 
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1.4.3 创建 Android 虚拟 设备 (AVD).….14 
144 ”模拟 器 的 总 结 ……… 
搭建 环境 过 程 中 的 常见 问题 ES 
AMET LII Mm 8 
1.5.2 显示 “Project name must be 


specified" 1i; … a 
Target 列表 中 没有 Target H. 21 


Android 系统 的 结构 


Android 安装 文件 简介 .…………… E 
2.1.1 Android SDK 目录 结构 2:25, 
2.1.2 androidjar 及 内 部 结构 
24.5 SDK 帮助 文档 …… ee 
2.14 解析 Android SDK 实例 1.26 
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2.2.1 Android 体系 结构 介绍 
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2.2.3 ”应 用 程序 的 生命 周期 
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24.2 Android 对 Linux 的 改造 .. 
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Ilo me 
2.4.4 分析 Android 源码 结构 
2.4.5 编译 Android 源码 … 
24.6 运行 Android 源码 … 
实践 演练 一 一 演示 两 种 编译 A Android 
RUE ucc 46 
2.5.1 编译 Native C 的 helloworld 
2.5.2 手工 编译 C 模块 . 
虚拟 机 概述 RR 51 
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3.24 Java 虚拟 机 的 生命 周期 58 
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3.3.1 Dalvik 3844 ............. 59 
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$1 Android 系统 介绍 


Android 是 2007 年 才 推出 的 一 款 智能 手机 平台 ， 它 是 建立 在 Linux 的 开源 基础 之 上 ， 能 够 
迅速 建立 手机 软件 的 解决 方案 。 虽 然 Android 的 外 形 比 较 简单 ， 但 是 其 功能 十 分 强大 ， 当 前 已 
经 成 了 一 个 新 兴 的 热点 ， 并 且 成 了 市 场 占有 率 排名 第 一 的 智能 手机 操作 系统 。 本 章 将 简单 介绍 
Android 系统 的 相关 知识 ， 让 读者 了 解 Android 的 发 展 之 路 。 


1.1 Android 是 一 款 智 能 手机 


其 实在 Android 系统 诞生 之 前 ， 智 能 手机 就 已 经 大 大 丰富 了 人 们 的 生活 ， 受 到 了 广大 手机 
用 户 的 追捧 。 各 大 手机 厂商 在 利益 的 驱动 之 下 ， 纷 纷 建立 了 自己 的 智能 手机 操作 系统 来 抢夺 市 
场 份额 。Android 系统 就 是 在 这 个 风起云涌 的 历史 背景 下 诞生 的 。 


1.1.1 什么 是 智能 手机 


智能 手机 是 指 具 有 像 个 人 电脑 那样 强大 的 功能 ， 拥 有 独立 的 操作 系统 ， 用 户 可 以 自行 安装 
游戏 等 第 三 方 服务 商 提供 的 程序 ， 并 且 可 以 通过 移动 通信 网 络 来 接 入 无 线 网 络 。 在 Android 系 
统 诞生 之 前 , 市面 上 已 经 有 了 多 款 智 能 手机 产品 , 例如 ,Symbian 和 微软 公司 的 Windows Mobile 
系列 等 。 
一 般 来 说 ， 智 能 手机 必须 具备 下 面 的 功能 标准 。 
O 操作 系统 必须 支持 新 应 用 的 安装 。 
(2) 高 速 处 理 芯片 。 
GB) 支持 播放 式 的 手机 电视 。 
(4) H 


扩充 。 

G) 具备 上 网 功能 。 

(4) 具备 PDA 的 功能 ， 能 够 实现 个 人 信息 管理 ， 日 程 记事 ， 任 务 安排 ， 多 媒体 应 用 ， 浏 览 
网 页 。 

(5) 可 以 根据 个 人 需要 扩展 机 器 的 功能 。 

(6) 扩展 性 能 强 ， 并 且 可 以 支持 第 三 方 软件 。 


11.2 ”当前 主流 的 智能 手机 系统 


在 当今 市 面 中 最 主流 的 智能 手机 系统 当 属 微软 、 塞 班 、PDA、 黑 莓 、 苹 果 和 本 书 的 主角 
Android. 


1. 微软 的 Windows Mobile 


Windows Mobile 是 微软 公司 的 一 款 杰 出 产品 , Windows Mobile 将 用 户 熟 悉 的 Windows 桌面 
扩展 到 了 个 人 设备 中 。 使 用 Windows Mobile 操作 系统 的 设备 主要 有 PPC 手机 、PDA、 随 身 音乐 
播放 器 等 。Windows Mobile 操作 系统 有 三 种 , 分 别 是 Windows Mobile Standard、Windows Mobile 
Professional, Windows Mobile Classic. 


2. 塞 班 系统 Symbian 


塞 班 系 统 是 由 诺基亚 、 索 尼 爱 立信 、 摩 托 罗 拉 、 西 门 子 等 几 家 大 型 移动 通信 设备 商 共 同 出 
资 组 建 的 一 个 合资 公司 。 该 公司 专门 研发 手机 操作 系统 , 现 已 被 诺基亚 全 额 收购 。Symbian 有 着 
良好 的 界面 , 采用 内 核 与 界面 分 离 技术 , 对 硬件 的 要 求 比较 低 , 支持 C++, Visual Basic 和 J2ME。 
目前 根据 人 机 界面 的 不 同 ，Symbian 的 UI(User Interface 用 户 界面 ) 平 台 分 为 Series60、Series80、 
Series90、UIQ 等 。 其 中 Series60 主要 是 用 在 数字 键盘 的 手机 ，Series80 是 为 完整 键盘 设计 的 ， 
Series90 则 是 为 触 控 笔 方式 而 设计 的 。 


注意 : (1) 2010 年 9 月 ， 诺 基 亚 公司 宣布 将 从 2011 年 4 月 起 从 Symbian 基金 会 (Symbian 
Foundation) 手 中 收回 Symbian 操作 系统 控制 权 。 由 此 看 来 , 诺基亚 公司 在 2008 年 全 资 收 
购 塞 班 公司 之 后 希望 继续 扩大 塞 班 影响 力 的 愿望 并 没有 实现 。 
(2) 在 苹果 和 Android 的 强大 市 场 攻势 下 ， 诺 基 亚 公司 在 2011 年 2 月 11 日 宣布 与 微软 
公司 达成 广泛 战略 合作 关系 ， 并 将 Windows Phone 作为 其 主要 的 智能 手机 操作 系统 。 这 
家 芬兰 手机 巨头 试图 通过 结盟 扭转 医 势 。 截 止 本 书 成 稿 时 ， 诺 基 亚 和 微软 公司 联合 推出 
了 最 新 版 本 Windows Phone 8. 
(3) 2011 年 8 月 15 日 ,谷歌 和 摩托 罗拉 移动 公司 共同 宣布 ， 谷歌 公司 将 以 每 股 40.00 K 
元 现金 收购 摩托 罗拉 移动 公司 ， 总 额 约 125 亿美 元 ， 相 比 摩托 罗拉 移动 公司 股份 的 收盘 
价 溢价 了 63 % ， 双 方 董事 会 都 已 全 票 通过 该 交易 。 谷 歌 公 司 的 CEO 拉 里 。 佩 奇 表示 ， 
摩托 罗拉 移动 公司 将 完全 专注 于 Android 系统 ， 收 购 摩托 罗拉 移动 公司 之 后 ， 将 增强 整 
个 Android 生态 系统 。 佩 奇 同时 表示 ，Android 将 继续 开源 ， 收 购 的 一 个 目的 是 为 了 获得 
专利 。 
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3. Palm 


Palm 是 流行 的 个 人 数字 助理 (PDA， 又 称 掌 上 电脑 ) 的 传统 名 字 。 从 广义 上 讲 ，Palm 是 PDA 
的 一 种 , 是 Palm 公司 发 明 的 ,而 从 狭义 上 讲 , Palm 是 Palm 公司 生产 的 PDA 产品 , 区 别 于 SONY 
公司 的 Clie 和 Handspring 公司 的 Visor/Treo 等 其 他 运行 Palm 操作 系统 的 PDA 产品 。 其 显著 特 
点 之 一 是 写 入 装置 输入 数据 的 方法 ， 用 户 能 够 点 击 显示 器 上 的 图 标 选择 输入 的 项 目 。2009 年 2 
月 11 A, Palm 公司 CEO Ed Colligan 宣布 以 后 将 专注 于 WebOS 和 Windows Mobile 的 智能 设备 ， 
而 将 不 会 再 有 基于 “Palm OS” 的 智能 设备 推出 ， 除 了 Palm Centro 会 在 以 后 和 其 他 运营 商 合 作 
时 继续 推出 。 


4. 黑莓 BlackBerry 


BlackBerry 是 加 拿 大 RIM 公司 推出 的 一 种 移动 电子 邮件 系统 终端 ， 其 特色 是 支持 推动 式 电 
子 邮件 、 手 提 电 话 、 文 字 短信 、 互 联网 传真 、 网 页 浏览 及 其 他 无 线 资讯 服务 ， 它 的 最 大 优势 是 
收发 邮件 。 正 因为 这 一 优势 ， 所 以 特别 收 到 了 商务 用 户 的 青睐。 


5.iOS 


iOS 作为 苹果 移动 设备 iPhone 和 iPad 的 操作 系统 ， 在 App Store 的 推动 下 ， 成 为 世界 上 引 
领 潮流 的 操作 系统 之 一 。 原 本 这 个 系统 名 为 “iPhone OS”， 直 到 2010 年 6 月 7 日 , 在 WWDC 
大 会 上 宣布 改名 为 “iOS”。iOS 的 用 户 界 面 的 概念 基础 上 是 能 够 使 用 多 点 触 控 直接 操作 。 控 制 
方法 包括 滑动 、 轻 触 开 关 及 按键 。 与 系统 交互 包括 滑动 (Swiping)、 轻 按 (Tapping)、 挤 压 (Pinching， 
通常 用 于 缩小 ) 及 反 向 挤 压 (Reverse Pinching or unpinching 通常 用 于 放大 )。 此 外 通过 其 自 带 的 加 
速 器 ， 可 以 令 其 旋转 设备 改变 其 y 轴 以 令 屏幕 改变 方向 ， 这 样 的 设计 令 iPhone 更 便于 使 用 。 

从 最 初 的 iPhone OS， 演 变 至 最 新 的 IOS 系统 ，iOS 成 为 苹果 新 的 移动 设备 操作 系统 ， 横 跨 
iPod Touch、iPad、iPhone， 成 为 苹果 最 强大 的 操作 系统 。 甚 至 新 一 代 的 Mac OS X Lion 也 借鉴 
了 iOS 系统 的 一 些 设计 ， 可 以 说 iOS 是 苹果 的 又 一 个 成 功 的 操作 系统 ， 能 给 用 户 带 来 极 佳 的 使 
用 体验 。 


6.Android 


Android 是 我 们 本 书 的 主角 ,是 谷歌 公司 于 2007 年 11 月 5 日 宣布 的 基于 Linux 平台 的 开源 
手机 操作 系统 的 名 称 。Android 平台 由 操作 系统 、 中 间 件 、 用 户 界面 和 应 用 软件 组 成 ， 号 称 是 首 
个 为 移动 终端 打造 的 真正 开放 和 完整 的 移动 软件 。 


1.2 Android 的 巨大 优势 


从 2007 年 11 月 5 日 诞生 起 ,到 2011 年 7 月 ， 安 卓 系统 在 智能 手机 的 占有 率 高 达 43%， 位 
居 智 能 手机 系统 占有 率 排行 榜 的 第 一 位 。 并 且 随 着 各 大 厂商 新 产品 的 推出 ， 必 然 会 继续 巩固 这 
一 地 位 。 为 什么 安 卓 能 在 这 么 多 的 智能 系统 中 脱颖而出 ， 成 为 市 场 占 有 率 第 一 的 手机 系统 呢 ? 
要 想 分 析 其 原因 ， 需 要 先 了 解 它 的 巨大 优势 ， 分 析 完 竟 是 哪些 优点 吸引 了 厂商 和 消费 者 的 青睐 。 

(1) 第 一 个 优势 一 一 系 出 名 门 

Android 是 出 身 于 Linux 家 族 ， 是 一 款 号 称 开源 的 手机 操作 系统 。 当 Android“ 一 炮 走红 ?” 
之 后 ， 各 大 手机 联盟 纷纷 加 入 ， 并 且 都 推出 了 各 自 系列 产品 。 这 个 联盟 由 包括 中 国 移动 、 三 星 、 
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摩托 罗拉 、 高 通 、 宏 达 电 和 T-Mobile 等 在 内 的 30 多 家 技术 和 无 线 应 用 的 领军 企业 组 成 。 通 过 
与 运营 商 、 设 备 制造 商 、 开 发 商 和 其 他 有 关 各 方 结 成 深层 次 的 合作 伙伴 关系 ， 希 望 借助 建立 标 
准 化 、 开 放 式 的 移动 电话 软件 平台 ， 在 移动 产业 内 形成 一 个 开放 式 的 生态 系统 。 

(2) 第 二 个 优势 一 一 开发 团队 的 支持 

Android 的 研发 队伍 阵容 豪华 , 包括 摩托 罗拉 、Google、HTC( 宏 达 电 子 )、 PHILIPS, T-Mobile, 
高 通 、 魅 族 、 三 星 、LG 以 及 中 国 移动 公司 在 内 的 34 家 企业 ， 他 们 都 将 基于 该 平台 开发 手机 的 
新 型 业务 ， 应 用 之 间 的 通用 性 和 互联 性 将 在 最 大 程度 上 得 到 保持 。 

(3) 第 三 个 优势 一 一 诱 人 的 奖励 机 制 

谷歌 公司 为 了 提高 程序 员 的 开发 积极 性 ， 不 但 为 他 们 提供 了 一 流 硬件 的 设置 和 一 流 的 软件 
服务 ， 而 且 还 采取 了 振奋 人 心 的 奖励 机 制 ， 定 期 召开 比赛 ， 创 意 和 应 用 夺魁 者 将 会 得 到 重奖 。 

(4) 第 四 个 优势 一 一 开源 

开源 意味 着 对 开发 人 员 和 手机 厂商 来 说 ，Android 是 完全 无 偿 免 费 使 用 的 。 因 为 源 代 码 公开 
的 原因 ， 所 以 吸引 了 全 世界 各 地 无 数 程序 员 的 热情 。 于 是 很 多 手机 厂商 都 纷纷 采用 Android 作 
为 自己 产品 的 系统 ， 甚 至 包括 很 多 山寨 厂商 。 而 对 于 开发 人 员 来 说 ， 众 多 厂商 的 采用 就 意味 着 
人 才 需 求 大 ， 所 以 纷纷 加 入 到 Android 的 开发 大 军 中 来 。 


1.3 在 电脑 上 启动 Android 虚拟 机 


要 想 在 电脑 中 启动 Android 虚拟 机 ， 需 要 做 很 多 事情 。 本 节 将 详细 介绍 在 Windows 环境 下 
搭建 启动 Android 虚拟 机 的 基本 过 程 。 
1.3.1 安装 Android SDK 


在 Android 虚拟 机 前 ， 一 定 需要 先 确 定 基于 Android 应 用 软件 所 需要 的 开发 环境 ， 具 体 要 求 
如 表 1-1 所 示 。 
表 1-1 开发 系统 的 需求 参数 


项 目 版 本 要 求 备 注 
Wind XP/Windows7/ 

iid miii EE 根据 自己 的 电脑 自行 选择 | 选择 自己 最 熟悉 的 操作 系统 

系统 Windows 8 

软件 开 截至 目前 , 最 新 手机 版 本 是 4.5， 

i X SDK 

AMET 选择 最 新 版 本 的 ERLER 
Eclipse 3.3 以 上 版 本 和 

IDE Eclipse IDE+ADT ADT(Android Development | 选择 for Java Developer 
Tools) 开发 插件 

其 他 jk cA Java SE Development Kit 5 | 不 能 选择 单独 的 JRE 进行 安 

em 或 6 装 ， 必 须要 有 IDK 


Android 开发 工具 是 由 多 个 开发 包 组 成 的 ， 其 中 最 主要 的 开发 包 如 下 。 
Q JDK: 可 以 到 网 址 http://www.oracle.com/technetwork/java/javase/downloads/index.html 


Qo» 
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下 载 。 
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Q Eclipse: 可 以 到 网 址 http:/www.eclipse.org/downloads/ F $È Eclipse IDE for Java 


Developers. 
口 Android SDK: 可 以 到 网 址 http://developer.android.com TF 2X. 
口 下 载 对 应 的 开发 插件 。 


1.3.2 安装 JDK、Eclipse、Android SDK 


本 书 所 介绍 的 Android 的 安装 是 以 Windows 7 为 平台 , 安装 的 软件 为 DK 1.6 、Eclipse 3.3、 
ADTI.5. Android SDK 4.0。 下 面具 体 介 绍 各 个 软件 的 安装 步骤 ， 并 且 在 配套 的 视频 中 有 更 详细 


的 介绍 。 
1. 安装 JDK 


安装 Eclipse 的 开发 环境 需要 IRE 的 支持 ， 在 Windows 上 安装 JRE/IDK 非常 简单 。 
(1) 在 Oracle 公司 的 官方 网 站 下 载 ， 网 址 为 http://www.oracle.com/technetwork/java/javase/ 


downloads/indexhtml， 如 图 1-1 所 示 。 


和 java | Sjavarx 加 Matteams 


Here are the Java SE downloads in detail: 


Java Platform, Standard Edition 


Java SE Tus JOK JRE 


This release includes eecurty enhancements 
‘and bug bes. Leam more » 


ct JOK7 Docs JRET Docs 


* wstataton dnstatanon 
nstudors insrutong 


~ ReleaseNotes — ^ Relessehctes 


* Amas * daa SE 
Produce. Emacs 
* Third Patr * Tic Party 
Licenses Licenses. 

Certes Stem 


amples of common tasks anc new 


1-1 Oracle 官方 下 载 页 面 
(2) 在 图 1-1 中 可 以 看 到 IDK 有 很 多 版 本 , 运行 Eclipse 时 虽然 只 需要 


JRE 就 可 以 了 , 但 是 


在 开发 Android 应 用 程序 的 时 候 ， 是 需要 完整 的 JDK(JDK 已 经 包含 了 JRE)， 且 要 求 其 版 本 在 


1.5 以 上 ， 这 里 选择 Java SE (IDK) 6， 其 下 载 页 面 如 图 1-2 所 示 。 
(3) 在 图 1-2 中 找到 JDK 6 Update 22, 单 击 其 右 侧 的 Download 按钮 后 
面 ， 在 此 输入 你 的 账号 信息 ， 如 果 没 有 账号 可 以 免费 注册 一 个 ， 然 后 单 庆 


弹出 填写 登录 信息 界 


图 1-3 所 示 。 


上 f Continue 按钮 ， 如 


«Q 
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There ls more Information on the available filos for dowmload on the Supported 
m Configurations paye 


‘Select Platform and Language for your downland: 


[lava Platform, Standard Edition eem [as 可 
DK 6 Update 22 (JDK or JRE) 


Language dsianguage 


Hio release includes perfarmance improvements ard 
lsccurityvulnorabilityfixes, Lear moro + Domiosd TDE| 


Br sele:tng ‘Corinue" below you hereby streot he terns and condiions ofthe Java SE 

vat Java Dal Need? You must have a copy of the JRE 一 一 一 一 一 一 

[clava Runtime Environment) on your syster torun Java 

lapnliratons and applets To develop Java applications 

[ard applets, vou need the JDK (Java Development Ki), 
hich includes the JRE 


bik 6 Docs. 


Installation 
instructions 


macnat Peace Loz in or Register ror aeamoralrunctonay ana bonstie 
Or heh “Continue” new Io proceed wth out Log I or Repststcn 


ReadMe 


RelesseNotes 


Qracie License Oradle License 


mapam f rura pary 
Suneoren System} Sunred System 
Cantowatons | Coniauators =a 


图 1-2 JDK 的 下 载 页 面 -3 ”输入 账号 信息 


(4) 来 到 选择 操作 系统 和 语言 界面 ,在 此 首先 选择 Windows， 然 后 单 击 Download 按钮 ， 如 
图 1-4 所 示 。 


DK 6 Update 17 
Download Java SE Development Kit Gu17 ‘Tris special release proves a few key as 
Pater: gu 
mw “本 Iestitatonirstmitons 
Language: —Á 
[o Relzscehctes 
Sun Leenos 


Ok here Y vourdowriosd di net stat 
adorelicoly 


1-4 选择 Windows 


经 过 上 述 操作 后 ， 开 始 下 载 安装 文件 jdk-6u22-windows-i586.exe。 
(5) 下 载 完 成 后 双击 jdk-6u22-windows-i586.exe 开始 进行 安装 , 将 弹出 安装 向 导 对 话 框 , 在 
此 单 击 【 下 一 步 】 按 钮 ， 如 图 1-5 所 示 。 


ORACLE 


欢迎 使 用 Java(TM) SE Development Kit 6 Update 22 安装 向 导 


此 向 导 格 引 导 您 完成 Java SE Development Kit 6 Update 22 的 安装 过 程 。 


Es pee 
图 1-5 安装 向 导 对 话 框 


第 1 章 Android 系统 介绍 


e 
(6) 弹出 【 自 定 义 安装 】 界 面 ， 在 此 选择 文件 的 安装 路 径 ， 如 图 1-6 所 示 。 
(7) 单 击 【 下 一 步 】 按 钮 ， 开 始 进行 安装 ， 如 图 1-7 所 示 。 


ARE TENETE. E ^h 
Wise SEEMA, IERULIERHIEBGIS PATEN 


ERO. 


m | 


图 1-6 【 自 定义 安装 】 界 面 
(8) 完成 后 弹出 【目标 文件 夹 】 界 面 ， 在 此 选择 要 
(9) 单 击 【 下 一 步 】 按 钮 后 继续 开始 安装 ， 如 图 1-9 所 示 。 
- File F3 
Q Sun 


EH 
C:\Program Fles|Isvaljdit 6.0. 221 


1-7 ”开始 安装 
安装 的 位 置 ， 如 图 1-8 所 示 。 


目 EH 


EH 状态 : 正在 安装 Java Runtime Enviror 
PavaWreet Eo. BENEEEEEEEREEEEEEEEIN 
现在 ， 您 可 以 免费 拥有 一 个 与 Microsoft Office 
兼容 的 功能 全 面 的 办 公 套 件 


^ EARRA, AEA, ER, RTLA. ERRIRE ARE 


* ER. MIRER Microsoft Office 文件 
* E 70 BTeIBBLUR Solaris, Windows, Linus 和 Mac HERI 


* 使 用 行业 标准 的 开放 文件 格式 (OpenDocument) 作为 默认 文件 格式 

* 内 置 的 一 键 式 POF 导出 

—— = 

& t E E A A openofficeo 


LL] 下 -#> 


1-8 【目标 文件 夹 】 界面 
(10) 完成 后 弹出 【完成 】 界 面 ， 单 击 【 完 成 】 按 钮 ， 完 成 整个 安装 过 程 ， 如 图 1-10 所 示 。 


:££ Ee 


Java(TM) SE Development Kit 6 Update 22 已 或 功 安装 
HERIOT PERE : 


1-9 继续 安装 


同时 显示 20K TEGER. MEE 


RIUBEGROAELRGESROTSERSRITTSEEEIB, SEQ A 
ERMER TIE. 


EZ] 


图 1-10 完成 安装 


«o 


anm 
hs FRA SEAR Android 虚拟 机 - 


注意 : 完成 安装 后 可 以 检测 软件 的 安装 是 否 成 功 ， 具体 方法 是 依次 单 击 [F] | 【运行 〗， 
在 运行 框 中 输入 “cmd” 并 按 Enter 键 ， 在 打开 的 CMD 窗口 中 输入 “java -Version”， 如 
果 显 示 如 图 1-11 所 示 的 提示 信息 ， 则 说 明 安 装 成 功 。 


version 


E Runtime Environment (build 1.6.8 -b84» 
Java HotSpot<TM> Client UM <build 17.1-b@3, mixed mode, sharing? 


C:\Documents and Settings \Administrator> 


图 1-11 CMD 窗口 

如 果 没 有 安装 成 功 ， 需 要 将 其 目录 的 绝对 路 径 添加 到 系统 的 PATH 中 。 具 体 做 法 如 下 。 

(1) 右 击 【我 的 电脑 】， 在 弹出 的 快捷 菜单 中 选择 【属性 】 | 【高 级 】 命 令 ， 单 击 下 面 的 
【环境 变量 】, 在 下 面 的 【系统 变量 】 处 选择 【新 建 】， 在 【变量 名 】 处 输入 “JAVA_HOME”， 
【变量 值 】 中 输入 刚才 的 目录 ， 比 如 C:\Program Files\Java\jdk1.6.0 22， 如 图 1-12 Aras. 

(2) 再 次 新 建 一 个 变量 名 为 classpath， 其 变量 值 如 下 。 

.;%JAVA_HOME%/lib/rt.jar;%JAVA_HOME%/lib/tools.jar 

单 击 【确定 】 按 钮 找到 PATH 的 变量 ， 双 击 变量 值 或 单 击 【确定 】 按 钮 编辑 ， 在 变量 值 最 
前 面 添加 如 下 值 。 


%JAVA_HOME%/bin; 


具体 如 图 1-13 所 示 。 


RIES 
变量 名 QD: [TAVA _HOME 
EOE RRS: classpath 
RGU: RANE 022 * 让 ib/rt. jar: XJAVA_HOMEX/1ib/ tools. jar 
[we ] mw | [mE] mw | 
图 1-12 设置 系统 变量 图 1-13 设置 系统 变量 


(3) 再 依次 单 击 【开始 】 | Ge ， 在 “运行 ”文本 框 中 输入 “cmd” 并 按 Enter 键 ， 在 
打开 的 CMD 窗口 中 输入 “java -version”， 如 果 显 示 如 图 1-14 所 示 的 提示 信息 ， 则 说 明 安 装 成 功 。 


1-14 CMD 界面 
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HEB: 上 述 变量 是 按照 编者 本 人 的 安装 路 径 设 置 的 ， 安 装 的 IDK 路 径 是 C:\Program 


Files\Java\jdk1.6.0 22. 


2. 安装 Eclipse 


在 安装 好 JDK 后 ， 就 可 以 接着 安装 Eclipse 了 ， 具 体 步 又 如 下 。 
(1) 打开 Eclipse 的 官方 下 载 页 面 http://www.eclipse.org/downloads/， 如 图 1-15 所 示 。 


Home Downloads Users Members Committers Resources Projects About Us 


Eclipse Downloads 


Projects 


sed on Eclipse 2.5 SR1)- Compare Packages 


Eclipse IDE for Java EE Developers (199 MB) 


[AL Toots for Jaa deveopere seating Java Ze and Web appiicatons, reluding a Java IDE, 
JEE| tools for Java EE, JPA, JSF, Myyn and others. More... 


Downloads: 1,195,339 


E Eclipse IDE for Java Developers (92 MB) 
g The essential tools for any Java developer, including a Java IDE, a CVS client, «ML Editor 


and Myyn. More... 
Downloads: 601,023 


Eclipse tor PHP Developers (139 MB) 


Tools for PHP developers creating Web applications, including PHP Development Tools 


> (PDT), Web Tools Flatform, Myyn and others, More... 
Downloads: 287,974 
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Q) 在 图 1-15 所 示 界 面 中 选择 Eclipse IDE for Java Developers (92 MB)， 来 到 其 下 载 的 镜像 
页 面 ， 在 此 只 需 选择 离 用 户 最 近 的 镜像 即 可 (一 般 推荐 的 下 载 速度 就 不 错 )， 如 图 1-16 所 示 。 


Home Downloads Users Members Committers Resources Projects About Us Search 


Eclipse downloads - mirror selection 


Downloads Home 


" Al downloads are providedunder the terms and cordiions of te Ecapse Foundation 
Bit Torrents Software User Agreement unless otherwise specified. 
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© Source code Oracle Develop 
% More Packages @ BitTorrent is solite for this fle. le Premis [ 
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Give Back to 
人 


图 1-16 ”选择 镜像 
(3) 下 载 完成 后 ， 先 找到 下 载 的 压缩 包 eclipse-java-galileo-SR1-win32.zip。 


注意 : 解压 Eclipse 下 载 的 压缩 文件 后 就 可 以 使 用 ， 而 无 须 执行 安装 程序 ， 不 过 在 使 用 前 一 定 要 
先 安 装 JDK。 在 此 假设 Eclipse 解压 后 存放 的 目录 为 F:\eclipse。 


(4) 进入 解压 后 的 目录 ， 此 时 可 以 看 到 一 个 名 为 “eclipse.exe” 的 可 执行 文件 ， 双 击 此 文件 
直接 运行 ，Eclipse 能 自动 找到 用 户 先期 安装 的 IDK 路 径 ， 启 动 界面 如 图 1-17 所 示 。 
(5) 因为 是 安装 后 第 一 次 启动 Eclipse， 所 以 会 看 到 选择 工作 空间 的 提示 ， 如 图 1-18 所 示 。 
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1-17 Eclipse 的 启动 界面 1-18 选择 工作 空间 


此 时 单 击 OK 按钮 ， 完 成 Eclipse 的 安装 。 
3. 安装 Andriod SDK 


完成 DK 和 Eclipse 的 安装 后 ， 接 下 来 需要 下 载 安 装 Andriod 的 SDK， 具 体 步骤 如 下 。 

(1) 打开 Android 开发 者 社区 网 址 http://developer.android.com/, 然后 转 到 SDK 下 载 页 面 (网 
址 是 http://developer.android.com/sdk/index.html)， 如 图 1-19 所 示 。 

(2) 在 此 选择 用 于 Windows 平台 的 链接 android-sdk I20-windows.zip， 弹 出 如 图 1-20 所 示 
的 对 话 框 。 


3 android-sdk_r20-windows. zip 
为 : WinRAR ZIP 压缩 文件 (88.2 MB) 


来 源 : http://dl. google. com 
1 您 起 要 Firefox 如何 处 理 此 文件 一 
| C 打 方式 加 [risu zrr RUD 
[保存 文件 全 i 
T 以 后 自动 采用 相同 的 动作 处 理 此 美文 件 。 (A) 


m | 
图 1-19 SOK 下 载 页 面 图 1-20 Android SDK 下 载 页 面 
下 载 后 解压 压缩 文件 ， 假 设 下 载 后 的 文件 解压 存放 在 F:\android\ 目 录 下 ， 并 将 其 tools 目录 
的 绝对 路 径 添 加 到 系统 的 PATH 中 ， 具 体操 作 步 又 如 下 。 
(1) 右 击 【 我 的 电脑 】, 在 弹出 的 快捷 菜单 中 选择 【属性 】|【 高 级 】 命 令 ， 单 击 下 面 的 【 环 
境 变量 】， 在 下 面 的 【系统 变量 】 处 选择 【新 建 】， 在 【变量 名 】 处 输入 “SDK_HOME”, [E 
量 值 】 中 输入 刚才 的 目录 ， 比 如 F:\android-sdk-windows, 1/4 1-21 所 示 。 


(2) 找到 PATH 的 变量 , 双击 【编辑 】 按钮 , 在 变量 值 最 前 面 加 上 %SDK_HOME%\tools:， 
如 图 1-22 所 示 。 


编辑 系统 变量 HE 
变量 名 W: STET] E: TTE [path 
SRW: fF : Vandroid-sdk-windows Es DH [aSDK_HOME®\ tools; NTAVA HOHEX/bin.C:" 
[we ] ww | [we ] | 
121 设置 系统 变量 图 1-22 设置 系统 变量 


e 

(3) 再 依次 单 击 【开始 】 | 【运行 】， 在 【和 运行】 文本 框 中 输入 “cmd” 并 按 Enter 键 , 在 

打开 的 CMD 窗口 中 输入 一 个 测试 命令 ， 例 如 android -h， 如 果 显 示 如 图 1-23 所 示 的 提示 信息 ， 
则 说 明 安装 成 功 。 


图 1-23 ”提示 信息 

4. 安装 ADT 

Android 为 Eclipse 定制 了 一 个 专用 插件 Android Development Tools(ADT), 此 插件 为 用 户 提 
供 了 一 个 开发 Android 应 用 程序 的 综合 环境 。ADT 扩展 了 Eclipse 的 功能 ， 可 以 让 用 户 快速 地 建 
立 Android 项 目 ， 创 建 应 用 程序 界面 。 要 安装 Android Development Tools plug-in， 需 要 首先 打开 
Eclipse IDE， 然 后 进行 如 下 操作 。 

(1) 打开 Eclipse 后 ， 依 次 单 击 菜单 栏 中 的 Help | Install New Software... 选 项 ， 如 图 1-24 
所 示 。 

(2) 在 弹出 的 对 话 框 中 单 击 Add 按钮 ， 如 图 1-25 Bras. 
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图 1-24 添加 插件 图 1-25 添加 插件 


(3) 在 弹出 的 Add Site 对 话 框 中 分 别 输入 名 字 和 地 址 ， 名 字 可 以 自己 命名 ， 例 如 “123”， 
但 是 在 Location 中 必须 输入 插件 的 网 络 地 址 “http://dl-ssl.google.com/Android/eclipse/”， 单 击 
OK 按钮 ， 如 图 1-26 所 示 。 
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图 1-26 设置 地 址 
(4) fik OK 按钮 ， 此 时 在 Install 界面 将 会 显示 系统 中 可 用 的 插件 ， 如 图 1-27 所 示 。 
(5) 选中 Android DDMS 和 Android Development Tools, 然后 单 击 Next 按钮 来 到 安装 界面 ， 
如 图 1-28 所 示 。 


(6) 选择 Iaccept 选项 ， 单 击 Finish 按钮 ， 开 始 进行 安装 ， 如 图 1-29 所 示 。 


RE 一 


Install Blocked: The user operati... for background work to complete.) 


Fetching com. android ide. eclipse. a... adt 0.9. 9. v201009221401-60953. jar 


图 1-29 开始 安装 

注意 : 在 上 面 的 步骤 中 ， 可 能 会 发 生 “ 计 算 插件 占用 资源 ”的 情况 ， 整 个 计算 过 程 有 点 慢 。 完 
成 后 会 提示 重启 Eclipse 来 加 载 插件 ， 重 启 后 就 可 以 使 用 了 。 并 且 不 同 版 本 的 Eclipse 安 
装 插件 的 方法 和 步骤 是 不 同 的 ， 但 是 都 大 同 小 异 ， 读 者 可 以 根据 操作 提示 能 够 自行 解决 。 


1.3.3 
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设 定 Android SDK Home 


当 完 成 上 述 插件 装备 工作 后 ， 此 时 还 不 能 使 用 Eclipse 创建 Android 项 目 ， 我 们 还 需要 在 
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Eclipse 中 设置 Android SDK 的 主 目录 。 

(1) 打开 Eclipse， 在 菜单 中 依次 单 击 Window | Preferences 项 ， 如 图 1-30 所 示 。 

(2) 在 弹出 的 界面 左 侧 可 以 看 到 Android 项 ， 选 中 Android 选项 ， 在 右 侧 设 定 Android SDK 
所 在 目录 为 SDK Location， 单 击 OK 按钮 完成 设置 ， 如 图 1-31 所 示 。 


图 1-30 Preferences 项 1-31 Preferences 窗口 


1.4 Android 模拟 器 


我 们 都 知道 程序 开发 需要 调试 ， 只 有 经 过 调试 后 才能 知道 程序 能 否 正确 运行 。 作 为 一 款 手 
机 系统 ， 怎 么 样 才能 在 电脑 平台 上 调试 Android 程序 呢 ? 不 用 担心 ， 谷 歌 公 司 为 我 们 提供 了 模 
拟 器 来 解决 我 们 担心 的 问题 。 所 谓 模拟 器 ， 就 是 指 在 电脑 上 模拟 安 卓 系统 ， 可 以 用 这 个 模拟 器 
来 调试 并 运行 开发 的 Android 程序 。 开 发 人 员 不 需要 一 个 真实 的 Android 手机 ， 只 要 通过 电脑 即 
可 模拟 运行 一 个 手机 ， 即 可 开发 出 应 用 在 手机 上 的 程序 。 模 拟 器 在 电脑 上 的 运行 效果 如 图 1-32 
所 示 。 


图 1-32 Android 模拟 器 在 电脑 上 的 运行 效果 
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1.4.1 Android 模拟 器 简介 


对 于 Android 程序 的 开发 人 员 来 说 ， 模 拟 器 的 推出 给 开发 人 员 在 开发 上 和 测试 上 带 来 了 很 
大 的 便利 。 无 论 在 Windows 下 还 是 Linux F, Android 模拟 器 都 可 以 顺利 运行 , 并且 利用 官方 提 
供 的 Eclipse 插件 ， 可 将 模拟 器 集成 到 Eclipse 的 IDE 环境 。 当 然 ， 也 可 以 从 命令 行 启动 Android 
模拟 器 。 

获取 模拟 器 的 方法 非常 简单 ， 既 可 以 从 官方 站 点 (http:/developer.Android.com/) 免 费 下 载 单 
独 的 模拟 器 ， 也 可 以 先 下 载 Android SDK， 解 压 后 在 其 SDK 的 根 目 录 下 有 一 个 名 为 “tools” 的 
文件 夹 ， 此 文件 夹 下 包含 了 完整 的 模拟 器 和 一 些 非常 有 用 的 工具 。 

Android SDK 中 包含 的 模拟 器 的 功能 非常 齐全 ， 电 话 本 、 通 话 等 功能 都 可 正常 使 用 (当然 你 
没 办 法 真 的 从 这 里 打 电 话 )， 甚 至 其 内 置 的 浏览 器 和 Maps 都 可 以 联网 。 用 户 可 以 使 用 键盘 输入 ， 
鼠标 单 击 模拟 器 按键 输入 ， 甚 至 还 可 以 使 用 鼠标 单 击 、 拖 动 屏幕 进行 操纵 。 


14.2 ”模拟 器 和 仿真 机 究竟 有 何 区 别 


当然 Android 模拟 器 不 能 完全 蔡 代 仿真 机 ， 具 体 来 说 有 如 下 差异 。 

模拟 器 不 支持 呼叫 和 接听 实际 来 电 ， 但 可 以 通过 控制 台 模 拟 电话 呼叫 ( 呼 入 和 呼出 )。 
模拟 器 不 支持 USB 连接 。 

模拟 器 不 支持 相机 /视频 捕捉 。 

模拟 器 不 支持 音频 输入 (捕捉 )， 但 支持 输出 ( 重 放 )。 

模拟 器 不 支持 扩展 耳机 。 

模拟 器 不 能 确定 连接 状态 。 

模拟 器 不 能 确定 电池 电量 水 平和 交流 充电 状态 。 

模拟 器 不 能 确定 SD 卡 的 插入 /弹出 。 

模拟 器 不 支持 蓝牙 。 


1.4.3 ”创建 Android 虚拟 设备 (AVD) 


下 面 开 始 介 绍 创建 Android 虚拟 设备 的 基本 方法 。 

(1) 首先 打开 Eclipse， 如 图 1-33 所 示 。 

(2) 在 弹出 的 Android SDK and AVD Manager 界面 的 左 侧 导 航 中 选择 Virtual device 选项 ， 
如 图 1-34 所 示 。 

在 Virtual device 列表 中 列 出 了 当前 已 经 安装 的 AVD 版 本 ， 可 以 通过 右 侧 的 按钮 来 创建 、 
删除 或 修改 AVD。 主 要 按钮 的 具体 说 明 如 下 。 
ee :创建 新 的 AVD， 单 击 此 按钮 在 弹出 的 界面 中 可 以 创建 一 个 新 AVD， 如 图 1-35 


CCCCODDCDU 


所 示 。 
HU |: 修改 已 经 存在 的 AVD. 
we | 删除 已 经 存在 的 AVD. 
E=, 启动 一 个 AVD 模拟 器 。 


Q^ 
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图 1-33 打开 Eclipse 
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图 1-34 Android SDK and AVD Manager 界面 


1-35 新 建 AVD 界面 
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注意 : 可 以 在 CMD 中 创建 或 删除 AVD， 例 如 可 以 按照 如 下 CMD 命令 创建 一 个 AVD。 


android create avd --name «your avd name» --target <targetID> 


其 中 “your avd name” 是 需要 创建 的 AVD 的 名 字 ,， 在 CMD 窗口 界面 中 的 如 图 1-36 所 示 。 


1-36 CMD 界面 


144 ”模拟 器 的 总 结 


要 正确 的 启动 Android 模拟 器 , 必须 先 要 创建 一 个 AVD(Android Virtual Device 虚拟 设备 )， 
读者 可 以 利用 AVD 创建 基于 不 同 版 本 的 模拟 器 。 有 关 创 建 和 使 用 Android 模拟 器 的 知识 请 读者 
参考 本 书 第 2 章 中 的 知识 。 在 此 对 Android 模拟 器 的 参数 进行 简单 总 结 ， 其 参数 格式 如 下 : 


emulator [option] [-qemu args] 


其 中 ，option 选项 的 具体 说 明 如 表 1-2 所 示 。 


表 1-2 模拟 器 选项 

选 项 功能 描述 
-sysdir <dir> 为 模拟 器 在 <dir> 目 录 中 搜索 系统 硬盘 镜像 
-system <file> 为 模拟 器 从 <file> 文 件 中 读 取 初 始 化 系统 镜像 
-datadir <dir> 设置 用 户 数据 写 入 的 目录 
-kemel <file> 为 模拟 器 设置 使 用 指定 的 模拟 器 内 核 
-ramdisk <file> 设置 内 存 RAM 镜像 文件 (默认 为 <system>/ramdisk img) 
-image <file> 废弃 ， 使 用 -system <file> HR 
-init-data <file> 设置 初始 化 数据 镜像 (默认 为 <system>/userdata.img) 
-initdata <file> 和 "-init-data <file>” 使 用 方法 一 致 
-data <file> 设置 数据 镜像 (默认 为 <datadir>/userdata-qemuimg) 
-partition-size <size> system/data 分 区 容量 大 小 (MB) 
-cache <file> 设置 模拟 器 缓存 分 区 镜像 (默认 为 零 时 文件 ) 
-no-cache 禁用 缓存 分 区 
-nocache 与 “-no-cache” 的 使 用 方法 相同 
-sdcard <file> 指定 模拟 器 SDCard 镜像 文件 (默认 为 <system>/sdcard.img) 
-wipe-data 清除 并 重 置 用 户 数据 镜像 (从 initdata 复制 ) 
-avd <name> 指定 模拟 器 使 用 Android 虚拟 设备 
-skindir <dir> 设置 模拟 器 皮肤 ， 在 <dir> 目 录 中 搜索 皮肤 (默认 为 <system>/skins 目录 ) 
-Skin <name> 选择 使 用 给 定 的 皮肤 


Q^ 
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选 项 功能 描述 
-no-skin 不 适用 任何 模拟 器 皮肤 
-noskin 与 “-no-skin” 的 使 用 方法 相同 
-memory <size> 物理 RAM 内存 大 小 (MB) 
-netspeed <speed> 设置 最 大 网 络 下 载 、 上 传 速度 
-netdelay <delay> 网 络 时 延 模 拟 
-netfast 禁用 网 络 形态 
-tarce <name> 代码 配置 可 用 
-show-kernel 显示 内 核 信息 
-shell 在 当前 终端 中 使 用 根 Shell 命令 
-no-jni Dalvik 运行 时 禁用 INT 检测 
-nojni 与 “-no-jni” 的 使 用 方法 相同 
-logcat <tag> 输出 给 定 tag 的 Logcat 信息 
-no-audio 禁用 音频 支持 
-noaudio 与 “-no-audio” 的 用 法 相同 
-audio <backend> 使 用 指定 的 音频 backend 
-audio-in <backend> 使 用 指定 的 输入 音频 backend 
-audoi-out <backend> 使 用 指定 的 输出 音频 backend. 
-raw-keys 禁用 Unicode 键盘 翻转 图 
-radio 重 定向 无 线 模式 接口 到 个 性 化 设备 
-port <port> 设置 控制 台 使 用 的 TCP 端口 
pors-consokport.-adbport^ | 设置 控制 台 使 用 的 TCP 端口 和 ADB 调试 桥 使 用 的 TCP 端口 


-Onion <image> 
-onion-alpha <%age> 
-onion-rotation 0|1|2|3 
-Scale <scale> 
-dpi-device <dpi> 
-http-proxy <proxy> 


在 屏幕 上 层 使 用 覆盖 PNG 图 片 
指定 上 层 皮肤 半 透 明度 
指定 上 层 皮肤 旋转 


调节 模拟 器 窗口 尺寸 三 种 ，1.0-3.0、dpi、auto) 
设置 设备 的 resolution (dpi 单位 默认 165) 
通过 一 个 HTTP 或 HTTPS 代理 来 创建 TCP 连接 


-timezone <timezone> 使 用 给 定 的 时 区 ， 而 不 是 主机 默认 的 
-dns-server <server> 在 模拟 系统 上 使 用 给 定 的 DNS 服务 
-cpu-delay <cpudelay> 调节 CUP 模拟 

-no-boot-anim 禁用 动画 来 快速 启动 

-no-window 禁用 图 形 化 窗口 显示 

-version 显示 模拟 器 版 本 号 

-report-console «socket» 向 远程 socket 报告 控制 台 端 口 

-gps <device> 重 定向 GPS 导航 到 个 性 化 设备 
-keyset <name> 指定 按键 设置 文件 名 

-shell-serial <device> 根 shell 的 个 性 化 设备 

-old-system 支持 旧版 本 (pre 1.4) 系 统 镜像 
-tcpdump <file> 把 网 络 数据 包 捕获 到 文件 中 
-bootchart «timeout bootcharting 可 用 
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续 表 
选 项 功能 描述 
-qemu args... 向 qemu 传递 参数 
-qemu -h 显示 qemu 帮助 
-verbose 与 “-debug-init” 的 使 用 方法 相同 
-debug <tags> 可 用 、 禁 用 调试 信息 
-debug-<tag> 使 指定 的 调试 信息 可 用 
-debug-no-<tag> 禁用 指定 的 调试 信息 
-help 打印 出 该 帮助 文档 
-help-<option> 打印 出 指定 option 的 帮助 文档 
-help-disk-images 关于 硬盘 镜像 帮助 
-help-keys 支持 按钮 捆绑 (手机 快捷 键 ) 
-help-debug-tags 显示 出 -debug <tag> 命 令 中 的 tag 可 选 值 
-help-char-devices 个 性 化 设备 说 明 
-help-environment 环境 变量 
-help-keyset-file 指定 按键 绑 定 设置 文件 
-help-virtula-device 虚拟 设备 管理 
-help-sdk-images 当 使 用 SDK 时 关于 硬盘 镜像 的 信息 
-help-build-images 当 构建 Android 时 ， 关 于 硬盘 镜像 的 信息 
-help-all 打印 出 所 有 帮助 
1.5 “ 拱 建 环境 过 程 中 的 常见 问题 
在 搭建 完成 开发 环境 后 ， 下 面 总 结 在 搭建 Android SDK 环境 过 程 中 出 现 过 的 问题 ， 帮 助 读 
者 快速 成 功 搭建 Android 开发 环境 。 
1.5.1 不 能 在 线 更 新 
在 安装 Android 后 ， 需 要 更 新 为 最 新 的 资源 和 配置 。 但 是 在 启动 Android 后 ， 经 常会 不 能 更 


新 ， 弹 出 如 图 1-37 所 示 的 错误 提示 。 


Tetching https://£-s51. google. con/androi /repexitory/reposi tory. xat 


ery/repoiitory.xal, reason MITIS E 
GU ERNEUT rds 
z 


图 1-37 不 能 更 新 
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Android 默认 的 在 线 更 新 地 址 是 https://dl-ssl.google.com/android/eclipse/， 但 是 经 常会 出 现 错 
误 。 如 果 此 地 址 不 能 更 新 ， 可 以 自行 设置 更 新 地 址 ， 修 改 为 http://dl-ssl.google.com/android/ 
repository/repository.xml。 具 体操 作 方 法 如 下 。 


(1) 单 击 Android 左 侧 的 Available Packages 选项 ， 然 后 单 击 下 面 的 Add Site... 按 钮 。 如 
1-38 所 示 。 


1-38 Available Packages 界面 


(2) 在 弹出 的 Add Site URL 对 话 框 中 输入 如 下 修改 后 的 地 址 ， 如 图 1-39 Bras 
http://dl-ssl.google.com/android/repository/repository.xml 


cu [//1-ss1. google. con/ androi d/reposi tory/reposi tory xnl 


图 1-39 修改 地 址 
G) 单 击 OK 按钮 完成 设置 ， 此 时 就 可 以 使 用 更 新 功能 了 ， 如 图 1-40 所 示 。 


SÈ Google APIs by Google Inc, Android APT 3, revision 3 
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1.5.8 显示 “Project name must be specified” 提 示 


在 Eclipse 中 新 建 Android 工程 时 ， 一 直 显 示 “Project name must be specified” 提 示 ， 如 
1-41 所 示 。 


1-41 New Android Project 窗口 


造成 上 述 问题 的 原因 是 Android 没有 更 新 完成 ， 需 要 进行 完全 更 新 。 具 体 方法 如 下 。 
(1) 打开 Android， 选 择 左 侧 的 Installed Packages， 如 图 1-42 所 示 。 


图 1-42 Installed Packages 界面 
(2) 右 侧 列表 中 选择 “Android SDK Tools ,revision11”， 在 弹出 窗口 中 选择 Accept， 最 后 
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单 击 Install Accepted 按钮 开始 安装 更 新 ， 如 图 1-43 所 示 。 


图 1-43 选择 更 新 


1.5.3 Target 列表 中 没有 Target 选项 


通常 来 说 ， 当 Android 开发 环境 搭建 完毕 后 ， 在 Eclipse 工具 栏 中 依次 单 击 Window | 
Preferences 命令 , 单 击 左 侧 的 Android 项 后 会 在 Preferences 中 显示 存在 的 SDK Targets, 如 网 1-44 
所 示 。 


Tean 
Usage Data Collector 
ES dation 

x" 


El 1-44 SDK Targets 列表 
但 是 往往 因为 各 种 原因 ， 会 不 显示 SDK Targets 列表 ， 并 且 在 图 1-44 中 也 不 显示 ， 并 输出 
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“Failed to find an AVD compatible with target” 错 误 提 示 。 
造成 上 述 问题 的 原因 是 没有 创建 AVD 成 功 ， 此 时 需要 手工 安装 来 解决 这 个 问题 ， 当 然 前 提 
是 Android 更 新 完毕 。 具 体 解决 方法 如 下 。 
(1) 在 “运行 ”文本 框 中 输入 “cmd”， 按 Enter 键 ， 打 开 CMD 窗口 ， 如 图 1-45 所 示 。 


1-45 CMD 窗口 
(2) 使 用 如 下 Android 命令 创建 一 个 AVD。 
android create avd --name <your avd name> --target <targetID> 


其 中 “your_avd_name” 是 需要 创建 的 AVD 的 名 字 ，CMD 窗口 中 的 内 容 如 图 1-46 所 示 。 


tings dministrator>android create avd —nane aa 一 target 3 
s a basic fndroid platfom 


wish to create a custom hardware profile [no] 


1-46 CMD 窗口 


在 图 1-46 的 窗口 中 创建 了 一 个 名 为 aa,target ID 为 3 的 AVD, 然 后 在 CMD 窗口 中 输入 “ny”， 
即 完 成 操作 ， 如 图 1-47 所 示 。 


with the following harduare config 
1cd.density-160 


:NDocuments and Settings Administrator 


1-47 CMD EH 


Android 
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Android 系统 涉及 的 功能 比较 多 ， 在 学 习 这 些 开 发 知识 前 ， 读 者 需要 先 了 解 和 Android 系统 
结构 相关 的 一 些 知识 。 本 章 将 简要 讲解 Android 系统 的 结构 的 基础 知识 ， 为 读者 学 习 本 书后 面 
的 高 级 知识 打下 基础 。 


2.1 Android 安装 文件 简介 


当 我 们 下 载 并 安装 Android SDK 后 ， 会 在 安装 目录 中 看 到 一 些 安装 文件 。 这 些 文件 具体 是 
干什么 用 的 呢 ? 在 本 节 的 内 容 中 ， 将 一 一 为 读者 解 开 谜 题 。 


2.1.1 Android SDK 目录 结构 


安装 Android SDK 后 的 目录 结构 如 图 2-1 所 示 。 
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Q add-ons: 里 面包 含 了 官方 提供 的 API 包 ， 最 主要 的 是 Map 的 API. 

Q docs: 里 面包 含 了 文档 ， 即 帮助 文档 和 说 明文 档 。 

O platforms: 针对 每 个 版 本 的 SDK 版 本 提供 了 和 其 对 应 的 API 包 以 及 一 些 示例 文件 , 其 
中 包含 了 各 个 版 本 的 Android， 如 图 2-2 所 示 。 


2-2 platforms 目录 项 
口 temp: 里 面包 含 了 一 些 常用 的 文件 模板 。 
口 tools: 包含 了 一 些 通用 的 工具 文件 。 
O usb_driver: 包含 了 AMD64 fll X86 下 的 驱动 文件 。 
Q SDK Setup.exe: Android 的 启动 文件 。 


2.1.2 android.jar 及 内 部 结构 


在 platforms 目录 下 的 每 个 Android 版 本 中 ， 都 有 一 个 名 为 androidjar 的 文件 。 例 如 
platforms\android-8 中 的 内 容 如 图 2-3 所 示 。 


F: \androi d-sdk-windows\platforms\android-8 
Los M g- Bg. 
— ^ 1 ge Bg- 
android. jar build prop a) framework. aid) 
Erecataite Jar File Har ER ATIL SPF 
MEE 路 "n 


sdk. properties source properties 
PROPERTIES 文件 PROPERTIES 文件 
gn] jns UE 


图 2-3 android.jar 文件 所 在 目录 


文件 android jar 是 一 个 标准 的 压缩 包 , 里 面包 含 了 编译 后 的 压缩 文件 和 全 部 的 API。 使 用 解 
压缩 工具 可 以 打开 此 压缩 文件 ， 解 压 后 可 以 看 到 其 内 部 结构 分 别 如 图 2-4 和 图 2-5 所 示 。 
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2-4 android jar 文件 结构 图 2-5 android jar 文件 结构 


2.1.3 SDK 帮助 文档 


要 想 深入 理解 各 个 文件 包 内 包含 的 API 的 具体 用 法 ,就 必须 学 会 阅读 和 查找 SDK 帮助 文档 。 
读者 可 以 使 用 浏览 器 打开 docs 目录 下 的 文件 index.html， 如 图 2-6 所 示 。 
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在 图 2-6 所 示 的 主页 中 , 介绍 了 Android 基本 概念 和 当前 常用 版 本 , 在 右 侧 和 项 端的 导航 中 
列 出 了 一 些 常用 的 链接 。 此 SDK 文件 对 于 初学 者 来 说 十 分 重要 ， 可 以 帮助 读者 解决 很 多 常见 的 
问题 ， 是 一 个 很 好 的 学 习 文档 和 帮助 文档 。 

单 击 导航 中 的 Dev Guide 按钮 打开 如 图 2-7 所 示 的 界面 。 

在 图 2-7 所 示 的 页 面 中 ， 左 侧 是 目录 索引 超 链接 ， 单 击 某 个 超 链 接 后 ， 可 以 在 右 侧 界 面 中 
显示 对 应 的 说 明 信 息 。 下 面 我 们 对 各 个 索引 目录 超 链接 进行 简单 的 介绍 。 

如 果 要 想 迅 速 地 理解 一 个 问题 或 知识 点 ， 可 以 在 搜索 对 话 框 中 对 SDK 进行 检索 。 当 然 ， 很 
多 热心 的 程序 员 和 学 者 对 SDK 进行 了 翻译 ， 网 络 上 有 了 很 多 SDK 中 文 版 ， 感 兴趣 的 读者 可 以 
从 网 络 中 获取 。 


图 2-6 SDK 文档 主页 
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2-7 SDK 文档 索引 


2.1.4 解析 Android SDK 实例 


在 Android SDK 的 安装 目录 中 有 一 个 名 为 “samples” 的 子 目 录 ， 在 里 面 保存 了 几 个 比较 具 
有 代表 性 的 演示 实例 ， 这 些 实例 从 不 同 的 方面 展示 了 SDK 的 特性 及 其 强大 的 功能 。 例 如 在 里 面 
有 一 个 名 为 “JetBoy” 的 项 目 ， 此 项 目 是 一 款 具备 声音 支持 的 游戏 实例 ， 模 拟 演 示 了 如 何在 游戏 
中 集成 SONiVOX 的 audioINSIDE 技术 的 过 程 ， 此 技术 是 SONIVOX 捐赠 给 手机 联盟 的 。 此 实 
例 可 以 完美 地 播放 背景 音乐 和 场景 ， 实 现 子弹 击 碎 飞 来 的 障碍 物 等 一 系列 的 效果 。 执 行 后 效果 
如 图 2-8 所 示 。 
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2-8 JetBoy 演示 
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本 节 将 详细 地 讲解 Android 应 用 程序 的 核心 构成 部 分 ， 为 读者 学 习 本 书后 面 的 网 络 应 用 开 
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发 打下 基础 。 
2.2.1 Android 体系 结构 介绍 


Android 作为 一 个 移动 设备 的 平台 , 其 软件 层次 结构 包括 操作 系统 (OS)、 中 间 件 (MiddleWare) 
和 应 用 程序 (Application)。 根 据 Android 的 软件 框图 ， 其 软件 层次 结构 自 下 而 上 分 为 以 下 4 层 。 

(1) 操作 系统 层 (OS)。 

(2) 各 种 库 (Libraries) 和 Android 运行 环境 (RunTime)。 

(3) 应 用 程序 框架 (Application Framework). 

(4) 应 用 程序 (Application)。 

上 述 各 个 层 的 具体 结构 如 图 2-9 所 示 。 


图 2-9 Android 操作 系统 的 组 件 结构 图 


1. 操作 系统 层 (OS) 


Android 使 用 Linux 2.6 作为 操作 系统 ，Linux 2.6 是 一 种 标准 的 技术 ， 也 是 一 个 开放 的 操作 
系统 。Android 对 操作 系统 的 使 用 包括 核心 和 驱动 程序 两 部 分 ，Android 的 Linux 核心 为 标准 的 
Linux 2.6 内 核 ，Android 更 多 的 是 需要 一 些 与 移动 设备 相关 的 驱动 程序 。 主 要 的 驱动 如 下 。 
显示 驱动 (Display Driver): 常用 基于 Linux 的 帧 缓冲 (Frame Buffer) 驱 动 。 

Flash 内 存 驱 动 (Flash Memory Driver): 是 基于 MTD 的 Flash 驱动 程序 。 
照相 机 驱动 (Camera Driver): 常用 基于 Linux 的 v4l(Video for Linux 的 缩写 ) 驱 动 。 
音频 驱动 (Audio Driver): 常用 基于 ALSA(Advanced Linux Sound Architecture， 高 级 
Linux 声音 体系 ) 驱 动 。 

WiFi 驱动 (Camera Driver): 基于 IEEE 802.11 标准 的 驱动 程序 。 

键盘 驱动 (KeyBoard Driver): 作为 输入 设备 的 键盘 驱动 。 

蓝牙 驱动 (Bluetooth Driver): 基于 IEEE 802.15.1 标准 的 无 线 传输 技术 。 

Binder IPC 驱动 : Android 一 个 特殊 的 驱动 程序 ， 具 有 单独 的 设备 节点 ， 提 供 进程 间 通 


信 的 功能 。 
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人 or 
Q Power Management( 能 源 管理 ): 管理 电池 电量 等 信息 。 
2. 各 种 库 (Libraries) 和 Android 运行 环境 (RunTime) 


本 层次 对 应 一 般 嵌 入 式 系统 ， 相 当 于 中 间 件 层次 。Android 的 本 层次 分 成 两 个 部 分 ， 一 个 是 
各 种 库 ， 另 一 个 是 Android 运行 环境 。 本 层 的 内 容 大 多 是 使 用 C 和 C++ 实现 的 。 其 中 包含 的 各 
种 库 如 下 。 

OQ CÈ: C 语言 的 标准 库 ， 也 是 系统 中 一 个 最 为 底层 的 库 ，C 库 是 通过 Linux 的 系统 调 

用 来 实现 。 

Q 多 媒体 框架 (MediaFrameword): 这 部 分 内 容 是 Android 多 媒体 的 核心 部 分 ， 基 于 
PacketVideo(PV) 的 OpenCORE， 从 功能 上 本 库 一 共 分 为 两 大 部 分 ， 一 个 部 分 是 音频 、 
视频 的 回放 (PlayBack)， 另 一 部 分 则 是 音 视频 的 纪录 (Recorder)。 

SGL: 2D 图 像 引擎 。 

SSL: SSL(Secure Socket Layer) 位 于 TCP/IP 协议 与 各 种 应 用 层 协 议 之 间 ， 为 数据 通信 
提供 安全 支持 。 

OpenGL ES 1.0: 提供 了 对 3D 的 支持 。 

界面 管理 工具 (Surface Management): 提供 了 对 管理 显示 子 系统 等 功能 。 

SQLite: 一 个 通用 的 嵌入 式 数据 库 。 

WebKit: 网 络 浏览 器 的 核心 。 

FreeType: 表示 位 图 和 矢量 字体 的 功能 。 

Android 的 各 种 库 一 般 是 以 系统 中 间 件 的 形式 提供 的 , 它们 均 有 的 一 个 显著 特点 就 是 与 移动 
设备 的 平台 的 应 用 密切 相关 。 

Android 运行 环境 主要 是 指 的 虚拟 机 技术 一 一 Dalvik。Dalvik 虚拟 机 和 一 般 Java 虚拟 机 (Java 
VM) 不 同 ， 它 执行 的 不 是 Java 标准 的 字 节 码 (Bytecode) 而 是 Dalvik 可 执行 格式 (.dex) 中 的 执行 文 
件 ,在 执行 过 程 中 ,每 一 个 应 用 程序 即 一 个 进程 (Linux 的 一 个 Process)。 二 者 最 大 的 区 别 在 于 Java 
VM 是 以 基于 栈 的 虚拟 机 (Stack-based), 而 Dalvik 是 基于 寄存 器 的 虚拟 机 (Register-based)。 显 然 ， 
后 者 最 大 的 好 处 在 于 可 以 根据 硬件 实现 更 大 的 优化 ， 这 更 适合 移动 设备 的 特点 。 


3. 应 用 程序 (Application) 


Android 的 应 用 程序 主要 是 用 户 界面 (User Interface) 方 面 的 ， 通 常用 Java 语言 编写 ， 其 中 还 
可 以 包含 各 种 资源 文件 (放置 在 res 目录 中 )。Java 程序 及 相关 资源 经 过 编译 后 ,将 生成 一 个 APK 
包 。Android 本 身 提供 了 主屏 幕 (Home)、 联 系 人 (Contact)、 电 话 (Phone)、 浏 览 器 (Browers) 等 众多 
的 核心 应 用 。 同 时 应 用 程序 的 开发 者 还 可 以 使 用 应 用 程序 框架 层 的 API 实现 自己 的 程序 。 这 也 
是 Android 开源 的 巨大 潜力 的 体现 。 


4. 应 用 程序 框架 (Application Framework) 


Android 的 应 用 程序 框架 为 应 用 程序 层 的 开发 者 提供 APIs， 它 实际 上 是 一 个 应 用 程序 的 框 
架 。 由 于 上 层 的 应 用 程序 是 以 Java 构建 的 ， 因 此 本 层次 提供 的 首先 包含 了 UI 程序 中 所 需要 的 
各 种 控件 ， 例 如 Views( 视 图 组 件 )， 其 中 又 包括 了 List( 列 表 )、Grid( 栅 格 )、Text Box( 文 本 框 )、 
Button( 按 钮 ) 等 ， 甚 至 一 个 嵌入 式 的 Web 浏览 

一 个 基本 的 Android 应 用 程序 可 以 利用 应 用 程序 框架 中 的 以 下 五 个 部 分 。 

Q ”Activity( 活 动 ) 
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Broadcast Intent Receiver( 广 播 意图 接收 者 ) 
Service( 服 务 ) 

Content Provider( 内 容 提 供 者 ) 

Intent and Intent Filter( 意 图 和 意图 过 滤器 ) 


Android 工程 文件 结构 


Android 的 应 用 工程 文件 主要 由 以 下 部 分 组 成 。 
src 文件 : 项 目 源 文件 都 保存 在 这 个 目录 里 面 。 


口 口 口 口 


2.2.2 


Android Library: 这 个 是 应 用 运行 的 Android 库 。 
assets 目录 : 里 面 主 要 放置 多 媒体 等 一 些 文件 。 
res 目录 : 里 面 主要 放置 用 到 的 资源 文件 。 
drawable 目录 : 主要 放置 用 到 的 图 片 资源 。 


ooooooocoa 


应 用 所 


日 到 的 Activity、Service， 以 及 receiver 等 。 
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Rjava 文件 :这 个 文件 是 Eclipse 自动 生成 的 ， 开 发 人 员 不 需要 去 修改 里 边 的 内 容 。 


layout AK: 主要 放置 用 到 的 布局 文件 ， 这 些 布 局 文件 都 是 XML 文件 。 
values Ho: 主要 放置 字符 串 (strings.xml)、 闫 色 (colors.xml)、 数 组 (arrays.xml)。 
Androidmanifest.xml: 相当 于 应 用 的 配置 文件 。 在 这 个 文件 里 边 , 必须 声明 应 用 的 名 称 ， 


在 Eclipse 中 ， 一 个 基本 的 Android 项 目的 目录 结构 如 图 2-10 所 示 。 


日 lpiell 
FI rc 
E con. exanplell 
日 -机 javax. gane 
D) Layer. java 
[J) LayerManager. java 
[J) Sprite. java 
由 - 国 TiledLayer. java 
GB cen [Generated Java Files] 
EE con. exenplell 
D R java. 
由 -可 Android 3.0 
D assets 
ERES res 
HD drawable 
SS layout 
四 main. xml 
BI rev 
EQ values 
四 strings. xml 
[A Androi dani fest. xnl 
default. properties 


图 2-10 Android 项 目的 目录 结构 
1. src 目录 
与 一 般 的 Java 项 目 一 样 ， 


“srce” 目 录 下 保存 的 是 项 目的 所 有 包 及 源 文件 (java)， 


“res” 目 


录 下 包含 了 项 目 中 的 所 有 资源 。 例 如 ， 程 序 图 标 (drawable)、 布 局 文件 (layout) 和 常量 (values) 等 。 
不 同 的 是 ， 在 Java 项目 中 没有 “gen” 目 录 ， 也 没有 每 个 Android 项 目 都 必须 有 的 


AndroidManfest.xml 文件 。 
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“java” 格 式 文件 是 在 建立 项 目 时 自动 生成 的 ， 这 个 文件 是 只 读 模 式 ， 不 能 更 改 。Rjava 
文件 是 定义 该 项 目 所 有 资源 的 索引 文件 。 先 来 看 看 HelloAndroid 项 目的 Rjava 文件 ， 例 如 下 面 
的 代码 : 


package com.yarin.Android.HelloAndroid; 
public final class R { 
public static final class attr ( 
} 
public static final class drawable { 
public static final int icon-0x7f020000; 
) 


public static final class layout ( 
public static final int main-0x7f030000; 
} 


public static final class string { 
public static final int app name-0x7f040001; 
public static final int hello-0x7f040000; 
} 
} 


从 上 述 代 码 中 可 以 看 到 定义 了 很 多 常量 , 并 且 会 发 现 这 些 常量 的 名 字 都 与 res 文件 夹 中 的 文 
件 名 相同 ， 这 再 次 证 明 .java 文件 中 所 存储 的 是 该 项 目 所 有 资源 的 索引 。 有 了 这 个 文件 ， 在 程序 
ph 使 用 资源 将 变 得 更 加 方便 ， 用 户 可 以 很 快 地 找到 要 使 用 的 资源 。 由 于 这 个 文件 不 能 被 手动 编 
辑 ， 所 以 当 我 们 在 项 目 中 加 入 了 新 的 资源 时 ， 只 需 刷新 一 下 该 项 目 ，.java 文件 便 会 自动 生成 所 
有 资源 的 索引 。 


2. 文件 AndroidManfest.xml 


在 文件 AndroidManfest.xml 中 包含 了 该 项 目 中 所 使 用 的 Activity、Service、Receiver， 下 面 
是 HelloAndroid 项 目 中 的 AndroidManfest.xml 文件 。 


«?xml Version="1.0" encoding="utf-8"?> 
<manifest xmlns:android="http://schemas.android.com/apk/res/android" 
package="com.yarin.Android.HelloAndroid" 
android:versionCode="1" 
android:versionName="1.0"> 
«application android:icon="@drawable/icon" 
android: label="@string/app_name"> 
<activity android:name=".HelloAndroid" 
android: label="@string/app_name"> 
<intent-filter> 
<action android:name="android.intent.action.MAIN" /> 
«category android:name="android.intent .category.LAUNCHER" /> 
</intent-filter> 
</activity> 
</application> 
<uses-sdk android:minSdkVersion="5" /> 
</manifest> 


在 上 述 代码 中 ，intent-filter 描述 了 Activity 启动 的 位 置 和 时 间 。 每 当 一 个 Activity( 或 者 操作 
系统 ) 要 执行 一 个 操作 时 ， 它 将 创建 出 一 个 Intent 的 对 象 ， 这 个 Intent 对 象 能 承载 的 信息 可 描述 


@> 


bi 
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你 想 做 什么 ， 你 想 处 理 什么 数据 ， 数 据 的 类 型 ， 以 及 一 些 其 他 信息 。 而 Android 则 会 和 每 个 
Application 所 暴露 的 intent-filter 的 数据 进行 比较 ,找到 最 合适 Activity 来 处 理 调用 者 所 指定 的 数 
据 和 操作 。 下 面 我 们 来 仔细 分 析 一 下 AndroidManfestxml 文件 ， 如 表 2-1 所 示 。 


表 2-1 AndroidManfestxml 分 析 


BS 数 说 AA 

manifest 根 节点 ， 描 述 了 package 中 所 有 的 内 容 

aus 包含 命名 空间 的 声明 。xmins:android=http://schemas.android.com/apk/res/android， 使 
得 Android 中 各 种 标准 属性 能 在 文件 中 使 用 ， 提 供 了 大 部 分 元 素 中 的 数据 

Package 声明 应 用 程序 包 
包含 package 中 application 级 别 组 件 声明 的 根 节点 。 此 元 素 也 可 包含 application 的 一 

application 些 全 局 和 默认 的 属性 ， 如 标签 、icon、 主 题 、 必 要 的 权限 等 。 一 个 manifest 能 包含 零 
个 或 一 个 此 元 素 (不 能 大 余 一 个 ) 

android:icon 应 用 程序 图 标 

android:label 应 用 程序 名 
用 来 与 用 户 交 互 的 主要 工具 。Activity 是 用 户 打 开 一 个 应 用 程序 的 初始 页 面 ， 大 部 分 
被 使 用 到 的 其 他 页 面 也 由 不 同 的 activity 所 实现 ， 并 声明 在 另外 的 activity 标记 中 。 

ei 注意 , 每 一 个 activity 必须 有 一 个 <activity> 标 记 对 应 , 无 论 它 给 外 部 使 用 或 是 只 用 于 


自己 的 package 中 。 如 果 一 个 activity 没有 对 应 的 标记 ， 你 将 不 能 运行 它 。 另 外 ， 为 
了 支持 运行 时 查找 Activity, 可 包含 一 个 或 多 个 <intent-filter> 元 素来 描述 activity 所 支 
持 的 操作 


android:name 应 用 程序 默认 启动 的 activity 


声明 了 指定 的 一 组 组 件 支 持 的 Intent 值 ， 从 而 形成 了 Intent Filter。 除 了 能 在 此 元 素 


intent-filter 下 指定 不 同类 型 的 值 ， 属 性 也 能 放 在 这 里 来 描述 一 个 操作 所 需 的 唯一 标签 、icon 和 
其 他 信息 

action 组 件 支持 的 Intent action 

category 组 件 支持 的 Intent Category。 这 里 指定 了 应 用 程序 默认 启动 的 activity 

uses-sdk 该 应 用 程序 所 使 用 的 sdk 版 本 相关 


3. 常量 的 定义 文件 


下 面 我 们 看 看 资源 文件 中 一 些 常量 的 定义 ， 如 String.xml， 例 如 下 面 的 代码 : 


<?xml version-"1.0" encoding-"utf-8"?» 


«resources» 


«string name="hello">Hello World, HelloAndroid!</string> 
«string name-"app name"»HelloAndroid«/string» 


«/resources» 


上 述 的 代码 非常 简单 ， 只 定义 了 两 个 普通 的 字符 串 资源 。 
接 下 来 我 们 来 分 析 HelloAndroid 项 目的 布局 文件 (layout)， 首 先 打开 文件 res\layout\main.xml, 


其 代码 如 下 。 


<?xml version-"1.0" encoding="utf-8"?> 
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«LinearLayout xmlns:android-"http://schemas.android.com/apk/res/android" 
android:orientation-"vertical" 
android:layout width-"fill parent" 
android:layout height-"fill parent" 

EOS RIDS 

android:layout width-"fill parent" 
android:layout height-"wrap content" 
android:text-"Gstring/hello" 

/> 

</LinearLayout> 

在 上 述 代码 中 ， 有 以 下 几 个 布局 和 参数 。 

ū <LinearLayout></LinearLayout>: 线性 版 面 配置 ， 在 这 个 标签 中 ， 所 有 元 件 都 是 按 由 上 

到 下 的 顺序 排列 的 。 

O android:orientation: 表示 这 个 介质 的 版 面 配置 方式 是 从 上 到 下 垂直 地 排列 其 内 部 的 

视图 。 

O android:layout_ width: 定义 当前 视图 在 屏幕 上 所 占 的 宽度 , fill_parent 即 填充 整个 屏幕 。 

口 android:layout_height: 定义 当前 视图 在 屏幕 上 所 占 的 高 度 , fill parent 即 填充 整个 屏幕 。 

Q wrap content: 随 着 文字 栏 位 的 不 同 而 改变 这 个 视图 的 宽度 或 高 度 。 

在 上 述 布局 代码 中 ， 使 用 了 一 个 TextView 来 配置 文本 标签 Widget( 构 件 )， 其 中 设置 的 属性 
android:layout width 为 整个 屏幕 的 宽度 ，android:layout height 可 以 根据 文字 来 改变 高 度 ， 而 
android:text 则 设置 了 这 个 TextView 要 显示 的 文字 内 容 ， 这 里 引用 了 @string 中 的 hello 字符 串 ， 
即 String.xml 文件 中 的 hello 所 代表 的 字符 串 资源 。hello 字符 串 的 内 容 "Hello World, Hello 
Android!" 这 就 是 我 们 在 Hello Android 项 目 运行 时 看 到 的 字符 串 。 


HER: 上 面 介绍 的 文件 只 是 主要 文件 ， 在 项 目 中 需要 我 们 自行 编写 。 在 项 目 中 还 有 很 多 其 他 的 
文件 ， 因 为 那些 文件 很 少 需要 我 们 特意 编写 ， 所 以 在 此 就 不 进行 讲解 了 。 


2.2.3 ”应 用 程序 的 生命 周期 


程序 也 如 同 自 然 界 的 生物 一 样 ， 有 自己 的 生命 周期 。 应 用 程序 的 生命 周期 即 程序 的 存活 时 
间 , 也 就 是 说 在 什么 时 间 内 有 效 。Android 是 一 构建 在 Linux 上 的 开源 移动 开发 平台 , 在 Android 
中 ， 多 数 情 况 下 每 个 程序 都 是 在 各 自 独立 的 Linux 进程 中 运行 的 。 当 一 个 程序 或 其 某 些 部 分 被 
请 求 时 ， 它 的 进程 就 “出 生 ” 了 ; 当 这 个 程序 没有 必要 再 运行 下 去 且 系统 需要 回收 这 个 进程 的 
内 存 用 于 其 他 程序 时 ， 这 个 进程 就 “死亡 ”了 。 可 以 看 出 ，Android 程序 的 生命 周期 是 由 系统 
控制 而 非 程序 自身 控制 的 。 这 和 我 们 编写 桌面 应 用 程序 时 的 思维 有 些 不 同 ， 一 个 桌面 应 用 程序 
的 进程 也 是 在 其 他 进程 或 用 户 请 求 时 被 创建 ， 但 是 往往 是 在 程序 自身 收 到 关闭 请 求 后 执行 一 个 
特定 的 动作 (比如 从 main 函数 中 返回 ) 而 导致 进程 结束 的 。 要 想 做 好 某 种 类 型 的 程序 或 者 某 种 平 
台 下 的 程序 开发 ， 最 关键 的 就 是 要 和 弄 清楚 这 种 类 型 的 程序 或 整个 平台 下 的 程序 的 一 般 工作 模式 
并 熟 记 在 心 。 在 Android 中 ， 程 序 的 生命 周期 控制 就 是 属于 这 个 范畴 。 

开发 人 员 必 须 理解 不 同 的 应 用 程序 组 件 ， 尤 其 是 Activity、Service 和 Intent Receiver。 了 解 
这 些 组 件 是 如 何 影响 应 用 程序 的 生命 周期 的 ， 这 非常 重要 。 如 果 不 正 确 地 使 用 这 些 组 件 ， 可 能 
会 导致 系统 终止 正在 执行 重要 任务 的 应 用 程序 进程 。 


Q^ 
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一 个 常见 的 进程 生命 周期 漏洞 的 例子 是 Intent Receiver( 意 图 接收 器 )， 当 Intent Receiver 在 
onReceive 方法 中 接收 到 一 个 Intent( 意 图 ) 时 ， 它 会 启动 一 个 线程 ， 然 后 返回 。 一 旦 返回 ， 系 统 将 
认为 Intent Receiver 不 再 处 于 活动 状态 , 因而 Intent Receiver 所 在 的 进程 也 就 不 再 有 用 了 (除非 该 
进程 中 还 有 其 他 的 组 件 处 于 活动 状态 )。 因 此 ， 系 统 可 能 会 在 任意 时 刻 终止 该 进程 以 回收 占有 的 
内 存 。 这 样 进程 中 创建 出 的 那个 线程 也 将 被 终止 。 解 决 这 个 问题 的 方法 是 从 Intent Receiver HJA 
动 一 个 服务 ， 让 系统 知道 进程 中 还 有 处 于 活动 状态 的 工作 。 为 了 使 系统 能 够 正确 决定 在 内 存 不 
足 时 应 该 终止 哪个 进程 ，Android 根据 每 个 进程 中 运行 的 组 件 及 组 件 的 状态 把 进程 放 入 一 个 
Importance Hierarchy( 重 要 性 分 级 ) 中 。 进 程 的 类 型 按 重要 程度 排序 包括 以 下 几 项 。 


1. 前 台 进 程 (Foreground) 


前 台 进 程 与 用 户 当前 正在 做 的 事情 密切 相关 。 不 同 的 应 用 程序 组 件 能 够 通过 不 同 的 方法 将 
其 宿主 进程 移 到 前 台 。 在 如 下 的 任何 一 个 条 件 下 : 进程 正在 屏幕 的 最 前 端 运行 一 个 与 用 户 交 互 
的 活动 (Activity)， 它 的 onResume 方法 被 调用 ; 或 进程 有 一 正在 运行 的 Intent. Receiver( 它 的 
IntentReceiver.onReceive 方法 正在 执行 ); 或 进程 有 一 个 服务 (Service)， 并 且 在 服务 的 某 个 回调 函 
数 (Service.onCreate、Service.onStart 或 Service.onDestroy) 内 有 正在 执行 的 代码 ， 系 统 将 把 进程 
移动 到 前 台 。 


2. 可 见 进程 (Visible) 

可 见 进程 有 一 个 可 以 被 用 户 从 屏幕 上 看 到 的 活动 ， 但 不 在 前 台 ( 它 的 onPause 方法 被 调用 )。 
例如 ， 如 果 前 台 的 活动 是 一 个 对 话 框 ， 以 前 的 活动 就 隐藏 在 对 话 框 之 后 ， 就 会 现 这 种 进程 。 可 
见 进程 非常 重要 ， 一 般 不 允许 被 终止 ， 除 非 是 为 了 保证 前 台 进 程 的 运行 而 不 得 不 终止 它 。 

3. 服务 进程 (Service) 


服务 进程 拥有 一 个 已 经 用 startService 方法 启动 的 服务 。 虽 然 用 户 无 法 直接 看 到 这 些 进程 ， 
但 它们 做 的 事情 却 是 用 户 所 关心 的 (如 后 台 MP3 回放 或 后 台 网 络 数据 的 上 传 下 载 )。 因 此 ， 系 统 
将 一 直 运行 这 些 进程 ， 除 非 内 存 不 足以 维持 所 有 的 前 台 进 程 和 可 见 进 程 。 


4. 后 台 进程 (Background) 


后 台 进程 拥有 一 个 当前 用 户 看 不 到 的 活动 ( 它 的 onStop 方法 被 调用 )。 这 些 进 程 对 用 户 体验 
没有 直接 的 影响 。 如 果 它 们 正确 执行 了 活动 生命 周期 ， 系 统 可 以 在 任意 时 刻 终止 该 进程 以 回收 
内 存 ， 并 提供 给 前 面 三 种 类 型 的 进程 使 用 。 系 统 中 通常 有 很 多 这 样 的 进程 在 运行 ， 因 此 要 将 这 
些 进 程 保存 在 LRU 列表 中 ， 以 确保 当 内 存 不 足 时 用 户 最 近 看 到 的 进程 最 后 一 个 被 终止 。 


5. 空 进程 (Empty) 


空 进程 是 不 拥有 任何 活动 的 应 用 程序 组 件 的 进程 。 保 留 这 种 进程 的 唯一 原因 是 在 下 次 应 用 
程序 的 某 个 组 件 需 要 运行 时 ， 不 需要 重新 创建 进程 ， 这 样 可 以 提高 启动 速度 。 

系统 将 以 进程 中 当前 处 于 活动 状态 组 件 的 重要 程度 为 基础 对 进程 进行 分 类 。 进 程 的 优先 级 
可 能 也 会 根据 该 进程 与 其 他 进程 的 依赖 关系 而 增长 。 例 如 ， 如 果 进 程 A 通过 在 进程 B 中 设置 
Context.BIND AUTO CREATE 标记 或 使 用 ContentProvider 被 绑 定 到 一 个 服务 (Service), 那么 进 
FEB 在 分 类 时 至 少 要 被 看 成 与 进程 A 同等 重要 。 例 如 Activity 的 状态 转换 图 如 图 2-11 所 示 。 
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Activity 启 动 
用 BACK 键 关 : 
闭 此 Activity 
结束 进程 


另 一 个 活动 来 到 前 台 


Activity 
如 果 其 他 应 用 在 前 台 运 行 


另 一 个 活动 来 到 前 台 


销毁 Activity 


图 2-11 Activity 状态 转换 图 
图 2-11 所 示 的 状态 变化 是 由 Android 内 存 管理 器 决定 的 ，Android 会 首先 关闭 那些 包含 
Inactive Activity 的 应 用 程序 ， 然 后 关闭 Stopped( 已 停止 ) 状 态 的 程序 。 在 极端 情况 下 ， 会 移 除 
Paused( 和 暂停 ) 状 态 的 程序 。 


2.3 {tf Android 内 核 


虽然 本 书 的 主要 内 容 是 讲解 Android 虚拟 机 的 知识 ， 但 是 为 了 让 读者 更 加 深入 了 解 每 一 个 
网 络 领域 的 具体 原理 ， 需 要 讲 一 些 底层 和 内 核 方面 的 知识 作为 补充 和 铺垫 ， 所 以 很 有 必要 为 读 
者 讲解 一 些 Android 内 核 源码 和 驱动 开发 方面 的 知识 。 


2.3.1 Android 继承 于 Linux 


Android 是 在 Linux 2.6 的 内 核 基础 之 上 运行 的 ， 提 供 的 核心 系统 服务 包括 安全 、 内 存 管理 、 
进程 管理 、 网 络 组 和 驱动 模型 等 内 容 。Android 内 核 部 分 还 相当 于 一 个 介 于 硬件 层 和 系统 中 其 他 
软件 组 之 间 的 一 个 抽象 层次 。 但 是 严格 来 说 它 不 算是 Linux 操作 系统 。 

因为 Android 内 核 是 由 标准 的 Linux 内 核 修改 而 来 的 ， 所 以 继承 了 Linux 内 核 的 诸多 优点 ， 
保留 了 Linux 内 核 的 主题 架构 。 同 时 Android 按照 移动 设备 的 需求 ， 在 文件 系统 、 内 存 管理 、 进 
程 间 通信 机 制 和 电源 管理 方面 进行 了 修改 ， 添 加 了 相关 的 驱动 程序 和 必要 的 新 功能 。 但 是 和 其 
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他 精简 的 Linux 系统 相 比 ， 例 如 uClinux, Android 在 很 大 程度 上 保留 了 Linux 的 基本 架构 ， 因 
此 Android 的 应 用 性 和 扩展 性 更 强 。 


2.3.2 Android 内 核 和 Linux 内 核 的 区 别 


Android 系统 的 系统 层面 的 底层 是 Linux, 并 且 在 中 间 加 上 了 一 个 叫 作 Dalvik 的 Java 虚拟 机 ， 
这 从 表面 层 看 是 Android 运行 库 。 每 个 Android 应 用 都 运行 在 自己 的 进程 上 ， 享 有 Dalvik 虚拟 
机 为 它 分 配 的 专 有 实例 。 为 了 支持 多 个 虚拟 机 在 同一 个 设备 上 高 效 运行 ，Dalvik 被 改写 过 。 

Dalvik 虚拟 机 执行 的 是 Dalvik 格式 的 可 执行 文件 (.dex) 一 一 该 格式 经 过 优化 , 以 将 内 存 耗 用 
降 到 最 低 。Java 编译 器 将 Java 源 文件 转 为 class 文件 ，class 文件 又 被 内 置 的 dx 工具 转化 为 dex 
格式 文件 ， 这 种 文件 在 Dalvik 虚拟 机 上 注册 并 运行 。 

Android 系统 的 应 用 软件 都 是 运行 在 Dalvik 上 的 Java 软件 , 而 Dalvik 是 运行 在 Linux 中 的 ， 
在 一 些 底层 功能 一 一 比如 线程 和 低 内 存 管 理 方面 ，Dalvik 虚拟 机 是 依赖 Linux 内 核 的 。 由 此 可 
见 ，Android 是 运行 在 Linux 上 的 操作 系统 ， 但 是 它 本 身 不 能 算是 Linux 的 某 个 版 本 。 

Android 内 核 和 Linux 内 核 的 差别 主要 体现 在 如 下 11 个 方面 。 

(1) Android Binder 

Android Binder 是 基于 OpenBinder 框架 的 一 个 驱动 ， 用 于 提供 Android 平台 的 进程 间 通 信 
(IPC, inter-process communication) 。 原来 的 Linux 系统 上 层 应 用 的 进程 间 通 信 主 要 是 
D-bus(desktop bus)， 采 用 消息 总 线 的 方式 来 进行 IPC. 

其 源 代码 位 于 drivers/staging/android/binder.c。 

(2) Android 电源 管理 (PM) 

Android 电源 管理 是 一 个 基于 标准 Linux 电源 管理 系统 的 轻 量 级 Android 电源 管理 驱动 ， 针 
对 艇 入 式 设 备 做 了 很 多 优化 。 利 用 锁 和 定时 器 来 切换 系统 状态 ， 控 制 设 备 在 不 同 状态 下 的 功 耗 ， 
以 达到 节能 的 目的 。 

其 源 代码 位 于 分 别 位 于 如 下 文件 : 

kernel/power/earlysuspend.c 

kernel/power/consoleearlysuspend.c 

kernel/power/fbearlysuspend.c 

kernel/power/wakelock.c 

kernel/power/userwakelock.c 

Q) 低 内 存 管理 器 (Low Memory Killer) 

Android 中 的 低 内 存 管理 器 和 Linux 标准 的 OOM(Out Of Memory) 相 比 ， 其 机 制 更 加 灵活 ， 
可 以 根据 需要 杀 死 进程 来 释放 需要 的 内 存 。Low memory killer 的 代码 非常 简单 ， 里 面 的 关键 是 
函数 Lowmem shrinker 。 作 为 一 个 模块 在 初始 化 时 调用 register shrinke 注册 一 个 
Lowmem shrinker， 它 会 被 vm 在 内 存 紧张 的 情况 下 调用 。Lowmem_ shrinker 完成 具体 操作 。 简 
单 说 就 是 寻找 一 个 最 合适 的 进程 杀 死 ， 从 而 释放 它 占 用 的 内 存 。 

其 源 代码 位 于 drivers/staging/android/lowmemorykiller.c. 

(4) 匿名 共享 内 存 (Ashmem) 

匿名 共享 内 存 为 进程 间 提 供 大 块 共享 内 存 ， 同 时 为 内 核 提供 回收 和 管理 这 个 内 存 的 机 制 。 
如 果 一 个 程序 尝试 访问 Kemel 释放 的 一 个 共享 内 存 块 ， 它 将 会 收 到 一 个 错误 提示 ， 然 后 重新 分 
配 内 存 并 重 载 数据 。 
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其 源 代码 位 于 mm/ashmem.c。 

(5) Android PMEM(Physical) 

PMEM 用 于 向 用 户 空间 提供 连续 的 物理 内 存 区 域 ，DSP 和 某 些 设备 只 能 工作 在 连续 的 物理 
内 存 上 。 驱 动 中 提供 了 mmap, open. release 和 ioctl 等 接口 。 

其 源 代码 位 于 drivers/misc/pmem.c. 

(6) Android Logger 

Android Logger 是 一 个 轻 量 级 的 日 志 设备 ， 用 于 抓 取 Android 系统 的 各 种 日 志 ， 是 Linux 所 
没有 的 。 

其 源 代码 位 于 drivers/staging/android/logger.c。 

(7) Android Alarm 

Android Alarm 提供 了 一 个 定时 器 用 于 把 设备 从 睡眠 状态 唤醒 ， 同 时 它 也 提供 了 一 个 即使 在 
设备 睡眠 时 也 会 运行 的 时 钟 基准 。 

其 源 代 码 位 于 如 下 文件 : 

drivers/rtc/alarm.c 

drivers/rtc/alarm-dev.c 

(8) USB Gadget 驱动 

此 驱动 是 一 个 基于 标准 Linux USB gadget 驱动 框架 的 设备 驱动 ，Android 的 USB 驱动 是 基 
于 gadget 框架 的 。 

其 源 代 码 位 于 如 下 文件 : 


drivers/usb/gadget/android.c 
drivers/usb/gadget/f adb.c 
drivers/usb/gadget/f mass storage.c 


(9) Android Ram Console 

为 了 提供 调试 功能 ，Android 允许 将 调试 日 志 信息 写 入 一 个 被 称 为 RAM Console 的 设备 里 ， 
它 是 一 个 基于 RAM 的 Buffer。 

其 源 代码 位 于 drivers/staging/android/ram console.c. 

(10) Android timed device 

Android timed device 提供 了 对 设备 进行 定时 控制 功能 , 目前 仅仅 支持 vibrator 和 LED 设备 。 

其 源 代码 位 于 drivers/staging/android/timed output.c(timed gpio.c). 

(11) Yaffs2 文件 系统 

在 Android 系统 中 ， 采 用 Yaffs2 作为 MTD NAND Flash 文件 系统 。Yaffs2 是 一 个 快速 稳定 
的 应 用 于 NAND 和 NOR Flash 的 跨 平台 的 嵌入 式 设 备 文件 系统 ， 同 其 他 Flash 文件 系统 相 比 ， 
Yaffs2 使 用 更 小 的 内 存 来 保存 其 运行 状态 ， 因 此 它 占 用 内 存 小 ，Yaffs2 的 垃圾 回收 非常 简单 而 
且 快 速 ， 因 此 能 达到 更 好 的 性 能 ; Yaffs2 在 大 容量 的 NAND Flash 上 性 能 表现 尤为 明显 ,非常 适 
合 大 容量 的 Flash 存储 。 

其 源 代码 位 于 fs/yaffs2/ A ae. 
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24 简 析 Android 源码 


源码 分 析 是 深入 掌握 Android 网 络 应 用 知识 的 前 提 工 作 , 本 节 将 简单 讲解 分 析 Android 源码 
的 基本 知识 ， 为 读者 学 习 本 书后 面 的 知识 打下 基础 。 


2.4.1 获取 并 编译 Android 源码 


在 分 析 Android 源码 之 前 , 需要 先 下 载 获取 Android 源码 。 读 者 可 以 登录 http://source.android.comy/ 
获取 Android 的 源码 ， 在 网 页 http://source.android.com/source/ downloading html 中 详细 介绍 了 获 
取 Android 源码 的 方法 ， 如 图 2-12 所 示 。 


open source project 


Hom Community About 


Compatibility Tech Info 


Downloading the Source Tree 
installing Repo 


Repo i a tool that makes i easier to work with Git in the context of Android For more information about Rapo, see Version Conte 


To install, intiakze, acd cor 


‘© Make sure you have a bin! directory in your home directory. and iat ifs included in your path 


$ mkdir ~/bin 
5 PATH--/bfn: PATH 


‘© Download the Repo script and ensure è is executable 


$ curl hetps://android. git.kernel.org/repo > ~/bin/repo 
S chmod arx ~/bin/repo 


‘+ The MOS checksum for repo ja cb06a064cd1845506715959652s098 


Repo clier 


2-12 Linux 下 获取 Android 源码 的 方法 
在 下 载 源码 时 ， 需 要 使 用 repo 或 git 工具 来 实现 。 接 下 来 将 详细 介绍 使 用 工具 获取 Android 
源码 的 流程 。 
(1) 创建 源 代码 下 载 目录 ， 命 令 如 下 。 


mkdir /work/android-froyo-r2 


Q) Hi repo 工具 初始 化 一 个 版 本 ， 假 如 是 Android 2.2r2， 则 命令 如 下 。 

cd /work/android-froyo-r2 

repo init -u git://android.git.kernel.org/platform/manifest.git -b froyo 

在 初始 化 过 程 中 会 显示 相关 的 版 本 的 TAG 信息 ， 同 时 会 提示 输入 用 户 名 和 邮箱 地 址 ， 上 面 
的 命令 初始 化 的 是 android 2.2 froyo 的 最 新 版 本 。 

(3) 因为 Android 2.2( 因 为 从 2.2 版 本 以 后 是 主要 针对 平板 应 用 的 升级 ， 所 以 在 此 以 2.2 版 
本 进行 探讨 ) 有 很 多 个 版 本 ， 这 些 版 本 信息 可 以 从 TAG 信息 中 看 出 来 。 当 前 froyo 的 所 有 版 本 信 
息 如 下 。 


* [new tag] android-2.2.1 rl -> android-2.2.1 r1 
* [new tag] android-2.2 rl -> android-2.2 r1 
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* [new tag] android-2.2 r1.1 -» android-2.2 r1.1 

* [new tag] android-2.2 r1.2 -» android-2.2 r1.2 

* [new tag] android-2.2 r1.3 -» android-2.2 r1.3 

* [new tag] android-cts-2.2 rl -> android-cts-2.2 r1 

* [new tag] android-cts-2.2 r2 -» android-cts-2.2 r2 

* [new tag] android-cts-2.2 r3 -» android-cts-2.2 r3 

每 次 下 载 的 都 是 最 新 的 版 本 ， 当 然 也 可 以 根据 TAG 信息 下 载 某 一 特定 的 版 本 。 例 如 下 面 的 


命令 : 

repo init -u git://android.git.kernel.org/platform/manifest.git -b android-cts-2.3 r1 

(4) 开始 下 载 源码 ， 命 令 如 下 。 

repo sync 

froyo 版 本 的 代码 很 大 ， 超 过 2G， 下 载 过 程 非常 漫长 ， 需 要 读者 耐心 等 待 。 

(5) 最 后 一 步 是 编译 代码 ， 命 令 如 下 。 

cd /work/android-froyo-r2 

make 

上 述 repo 获取 的 方式 获取 源码 的 速度 非常 慢 ,我 们 可 以 通过 网 页 浏览 的 方式 来 访问 Android 
代码 库 ， 其 浏览 路 径 是 http://android.git.kernel.org/， 界 面 如 图 2-13 所 示 。 


git clone git//andrcid git komolorg/ + project path. 
To clone the entire platform, install repo, and run: 
mkdir mydroid 


cd mydroid 
repo Iit -u git //android.git kernelorg/platform/manifest git 
repo syn 


For more information about git see an overview the tutorial or the man pages. 


Projects / 335 it 
sar 

Project Description Owner Last Change 

All-Projects.git revew source android com... Android Open Source... No commis tatma | here lbs ies 
 device/common git. Android Open Source.. 2 months ago emman | ihertios la | xes 
device/google/accessory/arduino.gt Android accessory support... Android Open Source... 2 months ago wel | abonos lg re 
device/google/accessory/demokit git Android eccessory support... Android Oper Source... 2 months ago mman | ibadiss llas | xas 
dovice/htc/common git. Files spacific to HTC devices... Android Open Source. 9 months ago seman sha Von se 
deviceshtc/dream-sapphire git Android Open Source. 10 months ago sce: bart as zu 
dovice/hte/dream.git Fils spocific to HTC dream... Android Open Source. 10 months ago ism iens Ga me 


2-13 页面 浏 览 方式 访问 Android 代码 库 


注意 : 因为 上 述 获取 Android 源码 的 过 程 非常 缓慢 ， 所 以 一 般 建议 不 要 使 用 repo FA Android 
源码 ， 建 议 直 接 登 录 http://www.androidin.com/bbs/pub/cupcake.tar.gz 来 下 载 ， 解 压 出 来 的 
“cupcake” PA “repo” ZIHR, seit Aiit repo sync 来 更 新 cupcake 代码 。 命令 

dT. 


tar -xvf cupcake.tar.gz 


2.4.3 Android 对 Linux 的 改造 


Android 内 核 是 基于 Linux 2.6 内 核 的 ， 这 是 一 个 增强 的 内 核 版 本 ， 除 了 修改 部 分 Bug 外 ， 
还 提供 了 用 于 支持 Android 平台 的 设备 驱动 。Android 不 但 使 用 了 Linux 内 核 的 基本 功能 ， 而 且 
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对 Linux 进行 了 改造 ， 以 实现 更 为 强大 的 通信 功能 。 
Android 中 的 Linux 内 核 与 驱动 结构 如 图 2-14 所 示 。 


系统 调用 接口 (System Call) 


ARM ARM ARM X86 
GoldFish|| MSM || OMAP 
2-14 Android 中 的 Linux 内 核 与 驱动 结构 


2.4.3 为 Android 构建 Linux 的 操作 系统 


如 果 我 们 以 一 个 原始 的 Linux 操作 系统 为 基础 , 改造 成 为 一 个 适合 于 Android 的 系统 ， 所 做 
的 工作 其 实 非 常 简单 一 一 仅仅 是 增加 适用 于 Android 的 驱动 程序 。 在 Android 中 有 很 多 Linux 系 
统 的 驱动 程序 ， 将 这 些 驱动 程序 移植 到 新 系统 的 步骤 非常 简单 ， 具 体 来 说 有 以 下 三 个 步骤 。 

(1) 编写 新 的 源 代 码 。 

(2) 在 KConfig 配置 文件 中 增加 新 内 容 。 

(3) 在 Makefile 中 增加 新 内 容 。 

在 Android 系统 中 ， 通 常会 使 用 FrameBuffer 驱动 、Event 驱动 、Flash MTD 驱动 、WiFi 驱 
动 、 蓝 牙 驱 动 和 串口 等 驱动 程序 。 并 且 还 需要 音频 、 视 频 、 传 感 器 等 驱动 和 sysfs 接口 。 移 植 的 
过 程 就 是 移植 上 述 驱动 的 过 程 , 我 们 的 工作 是 在 Linux. 下 开发 适用 于 Android 的 驱动 程序 ， 并 移 
植 到 Android 系统 。 

在 Android 中 添加 扩展 驱动 程序 的 基本 步骤 如 下 。 

(1) 在 Linux 内 核 中 移植 硬件 驱动 程序 ， 实 现 系统 调用 接口 。 

Q) 把 硬件 驱动 程序 的 调用 在 HAL 中 封装 成 Stub。 

(3) 为 上 层 应 用 的 服务 实现 本 地 库 ， 由 Dalv 让 虚拟 机 调用 本 地 库 来 完成 上 层 Java 代码 的 
实现 。 

(4) 最 后 编写 Android 应 用 程序 ， 提 供 Android 应 用 服务 和 用 户 操作 界面 。 


2.4.4 分 析 Android 源码 结构 
可 以 将 Android 源码 的 全 部 工程 分 为 如 下 三 个 部 分 。 


«eo 


口 


口 


口 


无 论 是 Android 1.5 还 是 Android 2.2 和 Android 2.3, 各 个 版 本 的 源码 目录 基本 类 似 。 在 里 面 


Core Project: 核心 工程 部 分 ， 这 是 建立 Android 系统 的 基础 ， 被 保存 在 根 目 录 的 各 个 
文件 夹 中 。 

External Project: 扩展 工程 部 分 ， 可 以 使 其 他 开源 项 目 具 有 扩展 功能 ， 被 保存 在 
“external” 文 件 夹 中 。 

Package: 包 部 分 ， 提 供 了 Android 的 应 用 程序 、 内 容 提供 者 、 输 入 法 和 服务 ， 被 保存 
在 “package” 文 件 夹 中 。 


包含 了 原始 Android 的 目标 机 代码 、 主 机 编译 工具 和 仿真 环境 。 在 接 下 来 的 内 容 中 ， 将 简单 介 
绍 Android 源码 的 目录 结构 ， 并 注释 了 常用 目录 的 含义 。 
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(1) 第 一 级 目录 

解压 缩 代码 包 后 ， 第 一 级 别 的 目录 和 文件 的 结构 如 下 。 

| - Makefile (全 局 的 Makefile) 

| - bionic (Bionic 含义 为 仿生 ， 这 里 面 是 一 些 基础 的 库 的 源 代码 ) 

| - bootloader (引导 加 载 器 ) 

| - build (build 目录 中 的 内 容 不 是 目标 所 用 的 代码 ， 而 是 编译 和 配置 所 需要 的 脚本 和 工具 ) 

| - daivik (JAVA 虚拟 机 ) 

| - development (程序 开发 所 需要 的 模板 和 工具 ) 

| - external (目标 机 器 使 用 的 一 些 库 ) 

| - frameworks (应 用 程序 的 框架 层 ) 

| - hardware (与 硬件 相关 的 库 ) 

| - kernel (Linux2 .6 的 源 代码 ) 

| - packages (Android 的 各 种 应 用 程序 ) 

| - prebuilt (Android 在 各 种 平台 下 编译 的 预 置 脚 本 ) 

| - recovery (与 目标 的 恢复 功能 相关 ) 

^- system (Android 的 底层 的 一 些 库 ) 

O Makefile: 是 整个 Android 编译 所 需要 的 真正 的 Makefile， 它 被 顶层 目录 的 Makefile 
引用 。 

口 Makefile 目录 下 的 envsetup.sh: 是 一 个 在 使 用 仿真 器 运行 的 时 候 ， 用 于 设置 环境 的 
脚本 。 

口 dalvik 目录 : 提供 Android Java 应 用 程序 运行 的 基础 一 一 JAVA 虚拟 机 。 

(2) development 目录 

展开 development 目录 后 ， 里 面 的 同一 个 级 别 的 目录 结构 如 下 。 

development 

|- apps (Android 应 用 程序 的 模板 ) 

| - build (编译 脚本 模板 ) 

|- cmds 

|- data 

|- docs 

| - emulator (仿真 相关 ) 

|- host (包含 windows 平台 的 一 些 工 具 ) 

|- ide 

|- pdk 

| - samples (一 些 示 例 程序 ) 

| - simulator (大 多 是 目标 机 器 的 一 些 工具 ) 

^- tools 
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Q Ask “emulator” : 里 面 的 “qemud” 是 使 用 QEMU 仿真 时 目标 机 器 运行 的 后 台 程序 ， 
“skins” 是 仿真 时 的 手机 界面 。 

Q HŠ “samples”: 在 里 面包 含 了 很 多 Android 简单 工程 ， 这 些 工程 为 开发 人 员 学 习 开 
发 Android 程序 提供 了 很 大 的 便利 ， 可 以 作为 模板 使 用 。 

(3) extemal 目录 

展开 external 目录 后 ， 里 面 的 同一 个 级 别 的 目录 结构 如 下 。 


external/ 
|- aes 

|- apache-http 
|- bluez 

|- clearsilver 
|- dbus 

|- dhcpca 
|- dropbear 
|- eifcopy 
|- eifutils 
|- emma 

|- esd 

|- expat 

|- falibm 
|- freetype 
|- gdata 

|- giflib 
|- googleclient 
|- icu4c 

|- iptables 
|- jdife 

|- jhead 

|- jpeg 

|- libffi 
|- libpcap 
|- libpng 
|- libxml2 
|- netcat 
|- netperf 
|- neven 

|- opencore 
|- openssl 
|- oprofile 
|- ping 

|- ppp 

|- protobuf 
|- qemu 

|- safe-iop 
|- skia 

|- sonivox 
|- sqlite 
|- srec 

|- strace 
|- tagsoup 


«@ 


tcpdump 
tinyxml 

tremor 

webkit 

wpa supplicant 
yaffs2 

zlib 


在 上 述 external 目录 中 , 每 个 目录 都 表示 Android 目标 系统 中 的 一 个 模块 ， 这 些 模 块 可 能 
一 个 或 者 多 个 库 构 成 。 其 中 常用 目录 的 具体 说 明 如 下 。 


O opencore: 是 Android 多 媒体 框架 的 核心 。 

O webkit: 是 Android 网 络 浏览 器 的 核心 。 

口 sqlite: 是 Android 数据 库 系统 的 核心 。 

Q openssl: 是 Secure Socket Layer, 表示 一 个 网 络 协议 层 , 用 于 为 数据 通信 提供 安全 支持 。 
(4) frameworks 目录 

展开 frameworks 目录 后 ， 里 面 的 同一 个 级 别 的 目录 如 下 。 

frameworks/ 

|- base 

|- opt 

^- policies 


O frameworks: 是 Android 应 用 程序 的 框架 。 

口 hardware: 是 一 些 与 硬件 相关 的 库 。 

口 kemel: 是 Linux 2.6 的 源 代码 。 

(5) packages 目录 

展开 packages 目录 后 ， 发 现 里 面包 含 了 两 个 目录 ， 其 中 目录 “apps” 中 保存 了 Android 中 
的 各 种 应 用 程序 ， 目 录 “providers” 中 保存 的 是 一 些 内 容 提 供 者 的 信息 ， 即 在 Android 中 的 一 个 
数据 源 。packages 目录 展开 后 的 具体 结构 如 下 。 

packages/ 

|- apps 


AlarmClock 
Browser 
Calculator 
Calendar 
Camera 
Contacts 
Email 
GoogleSearch 
HTMLViewer 

IM 

Launcher 

Mms 

Music 
PackageInstaller 
Phone 
Settings 
SoundRecorder 
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Stk 

Sync 
Updater 
VoiceDialer 


- providers 


CalendarProvider 
ContactsProvider 
DownloadProvider 

DrmProvider 
GoogleContactsProvider 
GoogleSubscribedFeedsProvider 
ImProvider 

MediaProvider 
TelephonyProvider 


目录 “packages” 中 两 个 目录 的 内 容 大 多 数 都 是 使 用 Java 编写 的 程序 ， 各 个 文件 夹 的 层次 
结构 是 类 似 的 。 

(6) prebuilt 目录 

展开 prebuilt 目录 后 的 同 级 别 目录 结构 如 下 。 

prebuilt/ 

|- Android.mk 

|- android-arm 

|- common 

|- darwin-x86 


|- linux-x86 
^- windows 


(7) system 目录 
展开 system 目录 后 ， 两 个 级 别 的 目录 结构 如 下 。 


system/ 
|- bluetooth 


bluedroid 
brfpatch 


|- core 


Android.mk 
README 

adb 

cpio 

debuggerd 
fastboot 
include (各 个 库 接口 的 头 文件 ) 
init 

libctest 
libcutils 
liblog 
libmincrypt 
libnetutils 
libpixelflinger 
libzipfile 
logcat 
logwrapper 


«Q 
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|- mkbootimg 
|- mountd 

|- netcfg 

|- rootdir 
|- sh 


`~- toolbox 
- extras 


|- Android.mk 
|- latencytop 
|- libpagemap 
|- librank 

|- procmem 

|- procrank 
|- showmap 

|- showslab 
|- sound 

|- su 

|- tests 

- timeinfo 


- wlan 


~= ti 


2.4.5 
编译 


编译 Android 源码 
Android 源码 的 方法 非常 简单 ,只 需要 使 用 Android 源码 主 目录 下 的 Makefile 文件 并 执 


行 make 命令 即 可 实现 。 在 编译 Android 源码 前 ， 需 要 先 确定 已 经 完成 同步 工作 。 进 入 Android 


源码 目录 
make 
编译 
要 耐心 等 


后 使 用 make 命令 进行 编译 ， 下 面 是 使 用 此 命令 的 格式 。 


Android 源码 可 以 得 到 “~/project/android /cupcake/out” 目 录 ， 编 译 过 程 会 有 点 慢 ， 需 
待 。 


虽然 编译 方法 非常 简单 ， 但 是 作为 初学 者 来 说 很 容易 出 错 ， 其 中 常见 的 编译 错误 有 如 下 


几 种 。 
1) 
进入 


host 


缺少 必要 的 软件 
Android 目录 ， 使 用 make 命令 编译 ， 可 能 会 出 现 如 下 错误 提示 。 


C: libneo cgi <= external/clearsilver/cgi/cgi.c 


external/clearsilver/cgi/cgi.c:22:18: error: zlib.h: No such file or directory 


上 述 
命令 如 下 


sudo 
同 理 
sudo 
sudo 
sudo 


sudo 
sudo 


错误 是 因为 缺少 zliblg-dev， 需 要 使 用 apt-get 命令 从 软件 仓库 中 安装 zliblg-dev， 具 体 


apt-get install zliblg-dev 
， 我 们 必须 安装 下 面 的 软件 ， 和 否则 也 会 出 现 上 述 类 似 的 错误 。 


apt-get install flex 
apt-get install bison 
apt-get install gperf 
apt-get install libsdl-dev 
apt-get install libesd0-dev 
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sudo apt-get install libncurses5-dev 

sudo apt-get install libxi1-dev 

2) ”没有 安装 Java 环境 IDK 

当 安装 所 有 上 述 软件 后 ， 运 行 make 命令 再 次 编译 Android 源码 。 如 果 在 之 前 忘记 安装 Java 
环境 JDK， 则 此 时 会 出 现 很 多 Java 文件 无 法 编译 的 错误 ， 如 果 打 开 Android 的 源码 ， 可 以 看 到 
在 如 下 目录 中 下 发 现 有 很 多 Java 源 文件 。 


android/dalvik/libcore/dom/src/test/java/org/w3c/domts 


这 充分 说 明 在 编译 Android 之 前 必须 先 安装 Java 环境 JDK， 安 装 流程 如 下 。 
(1) 从 Oracle 官方 网 站 下 载 jdk-6ul 6-linux-i586.bin 文件 ， 然 后 安装 。 
在 Ubuntu 8.04 中 ，“/etc/profile” 文 件 是 全 局 的 环境 变量 配置 文件 ， 适 用 于 所 有 的 shell. 
在 登录 Linux 系统 时 应 该 先 启动 “/etc/profile” 文 件 , 然后 再 启动 用 户 目 录 下 的 “~/.bash_profile”、 
“~/bash login ”或 “~/.profile ”文件 中 的 其 中 一 个 ， 执 行 的 顺序 和 上 面 的 排序 一 样 。 如 果 
“~/.bash_profile” 文 件 存在 的 话 ， 则 还 会 执行 “~/.bashre” 文 件 。 在 此 只 需要 把 IDK 的 目录 放 
到 “/etc/profile” 目 录 下 即 可 。 
JAVA HOME-/usr/local/src/jdk1.6.0 16 
PATH-$PATH:$JAVA HOME/bin: /usr/local/src/android-sdk-linux x86-1.1 r1/tools:-/bin 
(2) 重新 启动 机 器 ， 输 入 java -version 命令 ， 输 出 下 面 的 信息 则 表示 配置 成 功 。 


ava version "1.6.0 16" 
Java(TM) SE Runtime Environment (build 1.6.0 16-b01) 
Java HotSpot(TM) Client VM (build 13.2-b01, mixed mode, sharing) 


当成 功 编译 Android 源码 后 ， 在 终端 会 输出 如 下 提示 。 

Target system fs image: out/target/product/generic/obj/PACKAGING/systemimage unopt - 
intermediates/system.img 

Install system fs image: out/target/product/generic/system. img 

Target ram disk: out/target/product/generic/ramdisk.img 

Target userdata fs image: out/target/product/generic/userdata.img 

Installed file list: out/target/product/generic/installed-files.txt 
roote@dfsun2009-desktop: /bin/android# 


2.4.6 运行 Android 源码 


当 编译 完整 个 项 目 后 ， 需 要 在 系统 中 安装 模拟 器 后 才能 观看 编译 后 的 运行 效果 ， 当 前 最 新 
模拟 器 的 下 载 地 址 为 http://developer.android.com/sdk/index.html， 如 图 2-15 所 示 。 

解压 后 需要 把 目录 /usr/local/src/android-sdk-linux_x86-1.1_r12/tools 加 入 到 系统 环境 变量 
/etc/profile 中 。 然 后 找到 编译 后 Android 的 目录 文件 out， 此 时 会 发 现在 android/out/host/ 
linux-x86/bin 目录 下 多 了 很 多 应 用 程序 ， 这 些 应 用 程序 就 是 Android 得 以 运行 的 基础 ， 所 以 我 们 
需要 把 这 个 目录 也 添加 到 系统 PATH 下 ， 并 在 $SHOME/.profile 文件 中 加 入 如 下 内 容 。 


PATH="$PATH: $HOME/android/out/host/linux-x86/bin" 


«Q 


LET. Android 虚拟 机 -f 


opm 


developers 


36486190 bytes 8d5c104a34cs2577c5506c36d981a0br 


siae ri2 wndows ene (Recommended) 26531492 ytes 36/BedieciiDseic DOG acte dob. 


Mac OSX (miel) andisde rl2mae x85 zip 30231118 bytes 341544e4572btbfatab123ab917066e7 
Linux (386)  androi-sdk ri2jimux x36 132 30034243 bytes. 9485275c8dee3d1929336od538oc992 


androidsdk_r12inwe_06 497 is now downloading. Follow the steps below to get started. 


lows. dowload the installer for help with the ital setup ) 


2-45 ”最 新 SDK 的 下 载 页 面 


接 下 来 需要 把 Android 的 镜像 文件 加 载 到 emulator 中 , f£ emulator 可 以 看 到 Android 运行 的 
实际 效果 ， 然 后 在 “$HOME/.profile” 文 件 中 加 入 如 下 内 容 。 

ANDROID PRODUCT OUT=$HOME/android/out/target/product/generic 

export ANDROID PRODUCT OUT 

然后 重新 启动 机 器 ， 此 时 就 可 以 进入 到 模拟 器 目录 中 并 启动 模拟 器 。 

cd $HOME/android/out/target/product /generic 

emulator -image system.img -data userdata.img -ramdisk ramdisk.img 

上 述 流程 是 在 Linux 下 运行 Android 程序 的 方法 ， 和 本 书 第 一 章 介 绍 的 在 Windows 下 搭建 
Android 开发 环境 ， 并 运行 Android 程序 的 方法 完全 不 同 。 


2.5 ”实践 演练 一 一 演示 两 种 编译 Android 程序 的 方法 


Android 编译 环境 本 身 比 较 复杂 ， 并 且 不 像 普 通 的 编译 环境 那样 只 有 顶层 目录 下 才 有 
Makefile 文件 ， 而 其 他 的 每 个 component 都 使 用 统一 标准 的 Android.mk 文件 。 不 过 这 并 不 是 我 
们 熟悉 的 Makefile, 而 是 经 过 Android 自身 编译 系统 的 很 多 处 理 。 所 以 说 要 真正 理 清楚 其 中 的 联 
系 还 比较 复杂 ， 不 过 这 种 方式 的 好 处 在 于 ， 编 写 一 个 新 的 Android.mk 给 Android 增加 一 个 新 的 
Component 会 变 得 比较 简单 。 为 了 使 读者 更 加 深入 地 理解 在 Linux 环境 下 编译 Android 程序 的 方 
法 ， 在 接 下 来 的 内 容 中 ， 将 分 别 演示 两 种 编译 Android 程序 的 方法 。 


2.5.1 编译 Native C 的 helloworld 模块 


编译 Java 程序 可 以 直接 采用 Eclipse 的 集成 环境 来 完成 , 实现 方法 非常 简单 ,在 此 就 不 再 重 
复 了 。 接 下 来 主要 针对 C/C++ 来 说 明 ， 将 通过 一 个 例子 来 说 明 如 何在 Android 中 增加 一 个 C FE 
序 的 Hello World。 
(1) 在 $(YOUR_ANDROID)/development 目录 下 创建 一 个 名 为 “hello ”的 目录 ， 并 用 
$(YOUR_ANDROID) 指 向 Android 源 代码 所 在 的 目录 。 
- # mkdir $(YOUR ANDROID) /development/hello 
Q^ 
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(2) 在 目录 $CYOUR_ANDROID)/developmenthello/ 下 编写 一 个 名 为 “helloc” 的 C 语言 文 
文件 hello.c 的 代码 如 下 。 
#include <stdio.h> 
int main() 
{ 
printf ("Hello World!\n") ;// 输 出 Hello World 

return 0; 
} 
(3) 在 目录 $(YOUR_ANDROID)/development/hello/ 下 编写 Androidmk 文件 。 这 是 Android 
Makefile 的 标准 命名 ,不 能 更 改 .文件 Android.mk 的 格式 和 内 容 可 以 参考 其 他 已 有 的 Android.mk 
文件 的 写法 ， 针 对 helloworld 程序 的 Android.mk 文件 内 容 如 下 。 

LOCAL PATH:= $(call my-dir) 

include $(CLEAR VARS) 

LOCAL SRC FILES:- \ 

hello.c 
LOCAL MODULE :- helloworld 
include $(BUILD EXECUTABLE) 


Q LOCAL SRC FILES: 用 来 指定 源 文件 用 ; 

O LOCAL MODULE: 指定 要 编译 的 模块 的 名 字 ， 在 下 一 步骤 编译 时 将 会 用 到 ; 

口 include $(BUILD EXECUTABLE): 表示 要 编译 成 一 个 可 执行 文件 ， 如 果 想 编译 成 动态 
库 则 可 用 BUILD SHARED _LIBRARY， 这 些 具体 用 法 可 以 在 $(YOUR_ANDROID)/ 
build/core/config.mk 中 查 到 。 

(4) 回 到 Android 源 代码 项 层 目 录 进 行 编译 。 

# cd $(YOUR ANDROID) && make helloworld 


在 此 需要 注意 ，make helloworld 中 的 目标 名 helloworld 就 是 上 面 Android.mk 文件 中 由 
LOCAL MODULE 指定 的 模块 名 。 最 终 的 编译 结果 如 下 。 

target thumb C: helloworld <= development/hello/hello.c 

target Executable: helloworld (out/target/product/generic/obj/EXECUTABLES/helloworld intermediates 

/LINKED/helloworld) 

target Non-prelinked: helloworld (out/target/product/generic/symbols/system/bin/helloworld) 

target Strip: helloworld (out/target/product/generic/obj/EXECUTABLES/helloworld intermediates 

/helloworld) 

Install: out/target/product/generic/system/bin/helloworld 

(5) 如 果 和 上 述 编译 结果 相同 ， 则 编译 后 的 可 执行 文件 存放 在 如 下 目录 : 


out/target /product /generic/system/bin/helloworld 


这 样 通过 adb push 将 它 传送 到 模拟 器 上 ， 再 通过 adb shell 登录 到 模拟 器 终端 后 就 可 以 执 
行 了 。 


2.52 手工 编译 C 模块 
在 前 面 讲解 了 通过 标准 的 Android mk 文件 来 编译 C 模块 的 具体 流程 ,其 实 我 们 可 以 直接 运 


«Q 


fF 


= 


WP! 深入 理解 Android 虚拟 机 


用 gcc 命令 行 来 编译 C 程序 ， 这 样 可 以 更 好 地 了 解 Android 编译 环境 的 细节 。 具 体 流 程 如 下 。 


(1) 在 Android 编译 环境 中 , 提供 了 showcommands 选项 来 显示 编译 命令 行 , 我 们 可 以 通过 


打开 这 个 选项 来 查看 一 些 编译 时 的 细节 。 


Q) 在 具体 操作 之 前 需要 使 用 如 下 命令 把 前 面 中 的 helloworld 模块 清除 。 


# make clean-helloworld 


上 面 的 “make clean-$(LOCAL MODULE)" £i 4 %& Android 编译 环境 提供 的 make clean 


方式 。 


Q^» 


(3) 使 用 showcommands 选项 


# make helloworld showcommands 

build/core/product config.mk:229: WARNING: adding test OTA key 

target thumb C: helloworld «- development/hello/hello.c 
prebuilt/linux-x86/toolchain/arm-eabi-3.2.1/bin/arm-eabi-gcc 

-I system/core/include 

-I hardware/libhardware/include 

-I hardware/ril/include 

-I dalvik/libnativehelper/include 

-I frameworks/base/include 

-I external/skia/include 

-I out/target/product/generic/obj/include 

-I bionic/libc/arch-arm/include 

-I bionic/libc/include 

-I bionic/libstdc««/include 

-I bionic/libc/kernel/common 

-I bionic/libc/kernel/arch-arm 

-I bionic/libm/include 

-I bionic/libm/include/arch/arm 

-I bionic/libthread db/include 

-I development/hello 

-I out/target/product/generic/obj/EXECUTABLES/helloworld intermediates 

-c -fno-exceptions -Wno-multichar -march=armv5te -mtune=xscale -msoft-float -fpic 
-mthumb-interwork 

-ffunction-sections -funwind-tables -fstack-protector 

-D ARM ARCH 5  -D ARM ARCH 5T 

-D ARM ARCH 5E  -D ARM ARCH 5TE  -include system/core/include/arch/linux-arm/AndroidConfig.h 
-DANDROID -fmessage-length-0 -W -Wall -Wno-unused -DSK RELEASE -DNDEBUG -02 -g -Wstrict- 
aliasing-2-finline-functions -fno-inline-functions-called-once -fgcse-after-reload -frerun 
-cse-after-loop -frename- registers -DNDEBUG -UDEBUG -mthumb -Os -fomit-frame-pointer 
-fno-strict-aliasing -finline-limit-64 

-MD -o 

out/target/product/generic/obj/EXECUTABLES/helloworld intermediates/hello.o 
development/hello/hello.c 


ETE helloworld， 具 体 命令 如 下 。 


target Executable: helloworld (out/target/product/generic/obj/EXECUTABLES/helloworld_ 
intermediates 

/LINKED/helloworld) 

prebuilt/linux-x86/toolchain/arm-eabi-3.2.1/bin/arm-eabi-g«« -nostdlib -Bdynamic 

-W1, -T, build/core/armelf.x 

-W1, -dynamic-linker, /system/bin/linker 
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-Wl,--gc-sections 

-Wl, -z,nocopyreloc 

-o  out/target/product/generic/obj/EXECUTABLES/helloworld intermediates/LINKED/helloworld 
-Lout/target/product/generic/obj/lib 

-Wl,-rpath-link-out/target/product/generic/obj/lib -lc -lstdc++ 

-lm out/target/product/generic/obj/lib/crtbegin dynamic.oout/target/product/generic obj/ 
EXECUTABLES/helloworld intermediates/hello.o 

-W1, --no-undefined 
prebuilt/linux-x86/toolchain/arm-eabi-3.2.1/bin/../lib/gcc/arm-eabi/3.2.1/interwork/libgc 
c.a out/target/product/generic/obj/lib/crtend android.o 

target Non-prelinked: helloworld (out/target/product/generic/symbols/system/bin/helloworld) 
out/host/linux-x86/bin/acp -fpt out/target/product/generic/obj/EXECUTABLES/helloworld 
intermediates/LINKED/helloworld out/target/product/generic/symbols/system/bin/helloworld 
target Strip: helloworld (out/target/product/generic/obj/EXECUTABLES/helloworld intermediates/ 


helloworld) 
out/host/linux-x86/bin/soslim ^ --strip  --shady  --quiet ^ out/target/product/generic/ 
symbols/system/bin/helloworld --outfile 


out/target/product/generic/obj/EXECUTABLES/helloworld intermediates/helloworld 
Install: out/target/product/generic/system/bin/helloworld 


out/host/linux-x86/bin/acp -fpt out/target/product/generic/obj/EXECUTABLES/helloworld_ 
intermediates/helloworld out/target/product/generic/system/bin/helloworld 


从 上 述 命令 行 可 以 看 到 ，Android 编译 环境 所 用 的 交叉 编译 工具 链 如 下 : 
prebuilt/linux-x86/toolchain/arm-eabi-3.2. l/bin/arm-eabi-gcc 
其 中 参数 “-I” 和 “-L” 分 别 指定 了 所 用 的 C 库 头 文件 和 动态 库 文件 路 径 分 别 是 
“bionic/libe/include” 和 “out/target/product/generic/obj/lib”， 其 他 还 包括 很 多 编译 选项 以 及 -D 
所 定义 的 预 编译 宏 。 
(4) 此 时 就 可 以 利用 上 面 的 编译 命令 来 手工 编译 helloworld 程序 ， 首 先 手 工 删除 上 次 编译 
得 到 的 helloworld 程序 。 


# rm out/target/product/generic/obj/EXECUTABLES/helloworld intermediates/hello.o 
# rm out/target/product/generic/system/bin/helloworld 


然后 再 用 gec 编译 以 生成 目标 文件 。 


#prebuilt /linux-x86/toolchain/arm-eabi-3.2.1/bin/arm-eabi-gcec -I bionic/libc/arch-arm/ 
include -I bionic/libc/include -I bionic/libc/kernel/common 

-I bionic/libc/kernel/arch-arm 

-c -fno-exceptions -Wno-multichar -march-armv5te -mtune-xscale -msoft-float -fpic -mthumb- 
interwork 

-ffunction-sections -funwind-tables -fstack-protector 

-D ARM ARCH 5  -D ARM ARCH 5T  -D ARM ARCH 5E 

-D ARM ARCH 5TE - 

-include system/core/include/arch/linux-arm/AndroidConfig.h -DANDROID -fmessage-length-0 -W 
-Wall -Wno-unused -DSK RELEASE -DNDEBUG -02 -g -Wstrict-aliasing-2 -finline-functions 
-fno-inline-functions-called-once  -fgcse-after-reload  -frerun-cse-after-loop  -frename- 
registers -DNDEBUG -UDEBUG -mthumb -Os -fomit-frame-pointer -fno-strict-aliasing -finline- 
limit-64 

-MD -o out/target/product/generic/obj/EXECUTABLES/helloworld intermediates/hello.o 
development/hello/hello.c 


«Q 


LE. Android 虚拟 机 -f 


如 果 此 时 与 Android.mk 编译 参数 进行 比较 ， 会 发 现 上 面 主要 减少 了 不 必要 的 参数 “-I”。 
(5 接 下 来 开始 生成 可 执行 文件 。 


#prebuilt/linux-x86/toolchain/arm-eabi-3.2.1/bin/arm-eabi-gcc -nostdlib -Bdynamic 
-W1,-T,build/core/armelf.x 

-W1, -dynamic-linker, /system/bin/linker 

-W1, --gc-sections 

-Wl,-z,nocopyreloc -o 

out /target /product /generic/obj /EXECUTABLES/helloworld_intermediates/LINKED/helloworld 

-Lout/target/product/generic/obj/lib 

-W1, -rpath-link-out/target/product/generic/obj/lib 

-lc -lm out/target/product/generic/obj/EXECUTABLES/helloworld intermediates/hello.o 
out/target/product/generic/obj/lib/crtbegin dynamic.o 

-Wl,--no-undefined ./prebuilt/linux-x86/toolchain/arm-eabi-3.2.1/bin/../lib/gcc/arm-eabi/ 

3.2.1/interwork/libgcc.a out/target/product/generic/obj/lib/crtend android.o 


在 此 需要 特别 注意 的 是 参数 “-Wl,-dynamic-linker,/system/bin/linker”， 它 指定 了 Android 专 


用 的 动态 链接 器 是 “/systenybin/linker”， 而 不 是 平常 使 用 的 1d.so。 


(6) 最 后 可 以 使 用 命令 file 和 readelf 来 查看 生成 的 可 执行 程序 。 


# file out/target/product/generic/obj/EXECUTABLES/helloworld intermediates/ LINKED/helloworld 
out/target/product/generic/obj/EXECUTABLES/helloworld intermediates/LINKED/helloworld: ELF 
32-bit 

LSB executable, ARM, version 1 (SYSV), dynamically linked (uses shared libs), not stripped 
4 readelf -d out 

/target/product/generic/obj/EXECUTABLES/ helloworld intermediates/LINKED/helloworld |grep 
0x00000001 (NEEDED) Shared library: [libc.so] 

0x00000001 (NEEDED) Shared library: [libm.so] 


这 就 是 ARM 格式 的 动态 链接 可 执行 文件 ， 在 运行 时 需要 libe.so 和 libm.so。 当 提示 “not 


stripped” 时 表示 它 还 没 被 STRIP( 和 剥离 )。 嵌 入 式 系统 中 为 节省 空间 通常 将 编译 完成 的 可 执行 文 
件 或 动态 库 进 行 剥离 , 即 去 掉 其 中 多 余 的 符号 表 信息 。 在 前 面 “make helloworld showcommands " 
命令 的 最 后 我 们 也 可 以 看 到 ，Android 编译 环境 中 使 用 了 “out/host/linux-x86/bin/soslim” 工 具 进 
行 STRIP。 


W 


® An 


droid 
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虚拟 机 (Virtual Machine) 是 指 通过 软件 模拟 的 具有 完整 硬件 系统 功能 的 、 运 行 在 一 个 完全 隔 
离 的 环境 中 的 完整 计算 机 系统 。 本 章 将 简要 讲解 虚拟 机 技术 的 基本 知识 ， 为 读者 步 入 本 书后 面 
的 学 习 打 下 基础 。 


3.1 虚拟 机 的 作用 


通过 虚拟 机 软件 ， 可 以 在 一 台 物 理 计 算 机 上 模拟 出 一 台 或 多 台 虚 拟 的 计算 机 ， 这 些 虚拟 机 
就 像 真正 的 计算 机 那样 进行 工作 ， 例 如 可 以 安装 操作 系统 、 安 装 应 用 程序 、 访 问 网 络 资源 等 。 
对 于 我 们 而 言 ， 它 只 是 运行 在 我 们 物理 计算 机 上 的 一 个 应 用 程序 ， 但 是 对 于 在 虚拟 机 中 运行 的 
应 用 程序 而 言 ， 它 就 是 一 台 真 正 计 算 机 。 因 此 当 在 虚拟 机 中 进行 软件 评测 时 ， 系 统一 样 可 能 会 
ABE: 但 是 崩溃 的 只 是 虚拟 机 上 的 操作 系统 ， 而 不 是 物理 计算 机 上 的 操作 系统 ， 并 且 ， 使 用 虚 
拟 机 的 “Undo”( 恢 复 ) 功 能 ， 可 以 马上 恢复 虚拟 机 到 安装 软件 之 前 的 状态 。 

在 现实 应 用 中 ， 对 于 一 般 计 算 机 用 户 来 说 ， 使 用 虚拟 机 最 常见 的 情形 是 安装 双 系 统 。 例 如 
在 Windows 平台 上 安装 一 个 虚拟 机 ， 然 后 在 这 个 虚拟 机 中 安装 Linux 操作 系统 或 iOS 系统 ， 这 
样 就 实现 了 双 系统 功能 。 


3.2 Java 虚拟 机 


本 书 之 所 以 特意 讲解 Java 虚拟 机 的 知识 ， 
两 者 只 是 稍 有 差别 而 已 。 通 过 对 
向 对 比 。 


e 深入 理解 Android 虚拟 机 ~ 
器 、 堆 栈 、 寄 存 器 等 ， 还 具有 相应 的 指令 系统 。JVM 虚拟 机 的 运作 结构 如 图 3-1 所 示 。 
从 图 3-1 中 可 以 看 到 ，JVM 是 运行 在 操作 系统 之 上 的 ， 它 与 硬件 没有 直接 的 交互 。 我 们 再 
来 看 下 JVM 有 哪些 组 成 部 分 ， 如 图 3-2 所 示 。 


Class Files —» 
| t Stack Heap Method Area 
操作 系统 (如 Windows、Linux 等 7 PC Register Native Method Stack 
硬件 体系 ( 如 Intel 体 系 、SPAC 等 ) Execution Engine | —» Native Interface |— Native Libraies 
3-1. JVM 虚拟 机 的 运作 结构 图 3-2 JVM 构成 图 


1. 为 什么 要 使 用 Java 虚拟 机 


Java 语言 的 一 个 非常 重要 的 特点 就 是 与 平台 的 无 关 性 ， 而 使 用 Java 虚拟 机 是 实现 这 一 特点 
的 关键 。 一 般 的 高 级 语言 如 果 要 在 不 同 的 平台 上 运行 ， 至 少 需 要 编译 成 不 同 的 目标 代码 。 而 引 
入 Java 语言 虚拟 机 后 ，Java 语言 在 不 同 平台 上 运行 时 不 需要 重新 编译 。Java 语言 使 用 模式 Java 
虚拟 机 屏蔽 了 与 具体 平台 相关 的 信息 , 使 得 Java 语言 编译 程序 只 需 生成 在 Java 虚拟 机 上 运行 的 
目标 代码 ( 字 节 码 )， 就 可 以 在 多 种 平台 上 不 加 修改 地 运行 。Java 虚拟 机 在 执行 字 节 码 时 ， 把 字 节 
码 解释 成 具体 平台 上 的 机 器 指令 执行 。 


2. 谁 需要 了 解 Java 虚拟 机 


Java 虚拟 机 是 Java 语言 底层 实现 的 基础 ， 对 Java 语言 感 兴趣 的 读者 来 说 , 很 有 必要 对 Java 
虚拟 机 有 一 个 大 概 的 了 解 。 因 为 这 不 但 有 助 于 读者 理解 Java 语言 的 一 些 性 质 ， 而 且 也 有 助 于 使 
用 Java 语言 。 对 于 要 在 特定 平台 上 实现 Java 虚拟 机 的 软件 人 员 ，Java 语言 的 编译 器 作者 以 及 要 
用 硬件 芯片 实现 Java 虚拟 机 的 人 来 说 ， 则 必须 深刻 理解 Java 虚拟 机 的 规范 。 另 外 ， 如 果 你 想 扩 
展 Java 语言 ， 或 是 把 其 他 语言 编译 成 Java 语言 的 字 节 码 ， 你 也 需要 深入 地 了 解 Java 虚拟 机 。 


3.2.2 Java 虚拟 机 的 数据 类 型 


Java 虚拟 机 可 以 支持 下 面 的 Java 语言 的 基本 数据 类 型 。 
byte: 1 字 节 有 符号 整数 的 补 码 。 

short: 2 字 节 有 符号 整数 的 补 码 。 

int: 4 字 节 有 符号 整数 的 补 码 。 

long: 8 字 节 有 符号 整数 的 补 码 。 

float: 4 字 节 IEEE754 单 精度 浮 点 数 。 

double: 8 字 节 IEEE754 双 精 度 浮 点 数 。 

char: 2 字 节 无 符号 Unicode 字符 。 


ooooooo 


@> 
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Ub object: 对 一 个 Java Object( 对 象 ) 的 4 字 节 引 用 。 

O retumAddress: 4 字 节 ， 用 于 jsr/ret/jsr-w/ret-w 指令 。 

几乎 所 有 的 Java 类 型 检查 都 是 在 编译 时 完成 的 , 上述 列 出 的 原始 数据 类 型 数据 在 Java 程序 
执行 时 不 需要 用 硬件 标记 。 操作 这 些 原 始 数据 类 型 数据 的 字 节 码 (指令 ) 本 身 就 已 经 指出 了 操作 数 
的 数据 类 型 ， 例 如 iadd, ladd, fadd 和 dadd 指令 都 是 把 两 个 数 相 加 ， 其 操作 数 类 型 是 int、long、 
float 和 double。 虚 拟 机 没有 给 boolean( 布 尔 ) 类 型 设置 单独 的 指令 。boolean 型 的 数据 是 由 integer 
指令 ， 包 括 integer 返回 来 处 理 的 。boolean 型 的 数组 则 是 用 byte 数组 来 处 理 的。 虚拟 机 使 用 
IEEE754 格式 的 浮 点 数 。 不 支持 IEEE 格式 的 较 旧 的 计算 机 ， 在 运行 Java 数值 计算 程序 时 ， 可 

E 会 非常 慢 。 

虚拟 机 的 规范 对 于 object 内 部 的 结构 没有 任何 特殊 的 要 求 .在 Oracle 公司 的 实现 中 ,对 object 
的 引用 是 一 个 句柄 ， 其 中 包含 一 对 指针 : 一 个 指针 指向 该 object 的 方法 表 ， 另 一 个 指向 该 object 
的 数据 。 用 Java 虚拟 机 的 字 节 码 表示 的 程序 应 该 遵守 类 型 规定 。Java 虚拟 机 的 实现 应 拒绝 执行 
违反 了 类 型 规定 的 字 节 码 程序 。Java 虚拟 机 由 于 字 节 码 定义 的 限制 似乎 只 能 运行 于 32 位 地 址 空 
间 的 机 器 上 。 但 是 可 以 创建 一 个 Java 虚拟 机 ， 它 自动 地 把 字 节 码 转换 成 64 位 的 形式 。 从 Java 
虚拟 机 支持 的 数据 类 型 可 以 看 出 ，Java 对 数据 类 型 的 内 部 格式 进行 了 严格 规定 ， 这 样 使 得 各 种 
Java 虚拟 机 的 实现 对 数据 的 解释 是 相同 的 ， 从 而 保证 了 Java 的 与 平台 无 关 性 和 可 移植 性 。 


3.23 Java 虚拟 机 的 体系 结构 
Java 虚拟 机 由 如 下 五 个 部 分 组 成 。 


Q 一 组 指令 集 。 

口 一 组 寄存 器 。 

口 —^H. 

口 一 个 无 用 单元 收集 堆 (Garbage-collected-heap)。 
口 一 个 方法 区 域 。 


这 五 部 分 是 Java 虚拟 机 的 逻辑 成 分 ， 不 依赖 任何 实现 技术 或 组 织 方式 ， 但 它们 的 功能 必须 
在 真实 机 器 上 以 某 种 方式 实现 。 在 接 下 来 的 内 容 中 ， 将 简要 介绍 上 述 组 成 部 分 的 基本 知识 ， 更 
加 详细 的 知识 读者 可 以 参阅 本 书后 面 的 内 容 。 

1. Java 指令 集 


Java 虚拟 机 支持 大 约 248 个 字 节 码 ， 每 个 字 节 码 执行 一 种 基本 的 CPU 运算 , 例如 把 一 个 整 
数 加 到 寄存 器 、 子 程序 转移 等 。Java 指令 集 相 当 于 Java 程序 的 汇编 语言 。 

Java 指令 集中 的 指令 包含 一 个 单字 节 的 操作 符 ， 用 于 指定 要 执行 的 操作 ， 还 有 0 个 或 多 个 
操作 数 ， 提 供 操作 所 需 的 参数 或 数据 。 许 多 指令 没有 操作 数 ， 仅 由 一 个 单字 节 的 操作 符 构成 。 

虚拟 机 的 内 层 循环 的 执行 过 程 如 下 。 

do( 

取 一 个 操作 符 字 节 ;， 

根据 操作 符 的 值 执行 一 个 动作 ; 

)while (程序 未 结束 ) 

因为 指令 系统 的 简单 性 ， 所 以 使 得 虚拟 机 执行 的 过 程 十 分 简单 ， 这 样 有 利于 提高 执行 的 效 
率 。 指 令 中 操作 数 的 数量 和 大 小 是 由 操作 符 决定 的 。 如 果 操 作 数 比 一 个 字 节 大 ， 那 么 它 存储 的 


«Qo 


顺序 是 高 位 字 节 优先 。 假 如 一 个 16 位 的 参数 存放 时 占用 两 个 字 节 ， 其 值 为 
第 一 个 字 节 *256+ 第 三 个 字 节 


字 节 码 指令 流 一 般 只 是 字 节 对 齐 的 , 但 是 指令 tabltch 和 lookup 例外 ,在 这 两 条 指令 内 部 要 
求 强制 的 4 字 节 边界 对 齐 。 


2. SE 


Java 虚拟 机 的 寄存 器 用 于 保存 机 器 的 运行 状态 ， 与 微 处 理 器 中 的 某 些 专用 寄存 器 类 似 ， 所 
有 寄存 器 都 是 32 位 的 。 在 Java 虚拟 机 中 有 如 下 4 种 寄存 器 。 

Q pe: Java 程序 计数 器 。 

O optop: 指向 操作 数 栈 项 端的 指针 。 

Q frame: 指向 当前 执行 方法 的 执行 环境 的 指针 。 

O vas: 指向 当前 执行 方法 的 局 部 变量 区 第 一 个 变量 的 指针 。 

Java 虚拟 机 是 栈 式 的 ， 它 不 定义 或 使 用 寄存 器 来 传递 或 接受 参数 ， 其 目的 是 为 了 保证 指令 
集 的 简洁 性 和 实现 时 的 高 效 性 ， 特 别 是 对 于 寄存 器 数目 不 多 的 处 理 器 。 


3. $ 


Java 虚拟 机 中 的 栈 有 三 个 区 域 ， 分 别 是 局 部 变量 区 、 运 行 环境 区 、 操 作 数 区 。 

1) ”局 部 变量 区 

每 个 Java 方法 使 用 一 个 固定 大 小 的 局 部 变量 集 ， 它 们 按照 与 Vars 寄存 器 的 字 偏 移 量 来 寻 址 。 
局 部 变量 都 是 32 位 的 。 长 整数 和 双 精 度 浮 点 数 占据 了 两 个 局 部 变量 的 空间 ， 却 按照 第 一 个 局 部 
变量 的 索引 来 寻 址 。( 例 如 ， 一 个 具有 索引 的 局 部 变量 ， 如 果 是 一 个 双 精 度 浮 点 数 ， 那 么 它 实 
际 占据 了 索引 n 和 n+l 所 代表 的 存储 空间 。) 虚 拟 机 规范 并 不 要 求 在 局 部 变量 中 的 64 位 的 值 是 
64 位 对 齐 的 。 虚 拟 机 提供 了 把 局 部 变量 中 的 值 装载 到 操作 数 栈 的 指令 ， 也 提供 了 把 操作 数 栈 中 
的 值 写 入 局 部 变量 的 指令 。 

2) ”运行 环境 区 

在 运行 环境 中 包含 的 信息 可 以 实现 动态 链接 、 正 常 的 方法 返回 与 异常 和 错误 传播 。 

(1) 动态 链接 。 

运行 环境 包括 对 指向 当前 类 和 当前 方法 的 解释 器 符号 表 的 指针 ， 用 于 支持 方法 代码 的 动态 
链接 。 方 法 的 class 文件 代码 在 引用 要 调用 的 方法 和 要 访问 的 变量 时 使 用 符号 。 动 态 链接 把 符号 
形式 的 方法 调用 翻译 成 实际 方法 调用 ， 装 载 必要 的 类 以 解释 还 没有 定义 的 符号 ， 并 把 变量 访问 
翻译 成 与 这 些 变 量 运行 时 的 存储 结构 相应 的 偏 移 地 址 。 动 态 链接 方法 和 变量 使 得 方法 中 使 用 的 
其 他 类 的 变化 不 会 影响 到 本 程序 的 代码 。 

(2) 正常 的 方法 返回 。 

如 果 当 前 方法 正常 地 结束 了 ， 在 执行 了 一 条 具有 正确 类 型 的 返回 指令 时 ， 调 用 的 方法 会 得 
到 一 个 返回 值 。 执 行 环境 在 正常 返回 的 情况 下 用 于 恢复 调用 者 的 寄存 器 ， 并 把 调用 者 的 程序 计 
数 器 增加 一 个 恰当 的 数值 ， 以 跳 过 已 执行 过 的 方法 调用 指令 ， 然 后 在 调用 者 的 执行 环境 中 继续 
执行 下 去 。 

G) 异常 和 错误 传播 。 

异常 情况 在 Java 中 被 称 作 Error( 错 误 ) 或 Exception( 异 常 )， 是 Throwable 类 的 子 类 ， 在 程序 
中 的 原因 有 如 下 两 点 : 
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© 动态 链接 错 ， 如 无 法 找到 所 需 的 class 文件 。 

© 运行 时 出 错 ， 如 对 一 个 空 指针 的 引用 程序 使 用 了 throw 语句 。 当 发 生 异 常 时 ，Java 虚 
拟 机 采取 如 下 措施 解决 。 

口 检查 与 当前 方法 相 联 系 的 catch 子 句 表 。 每 个 catch 子 句 包含 其 有 效 指令 范围 ， 能 够 处 

理 异 常 类 型 ， 以 及 处 理 异 常 的 代码 块 地 址 。 

O 与 异常 相 匹 配 的 catch 子 句 应 该 符合 下 面 的 条 件 : 造成 异常 的 指令 在 其 指令 范围 内 , 发 
生 的 异常 类 型 是 其 能 处 理 的 异常 类 型 的 子 类 型 。 如 果 找 到 了 匹配 的 catch FA), MAR 
统 将 转移 到 指定 的 异常 处 理 块 处 执行 。 如 果 没 有 找到 异常 处 理 块 ， 则 重复 寻找 匹配 的 
catch FAME, AEA ATM PTA REN catch 子 句 都 被 检查 过 。 

Q ”由 于 虚拟 机 从 第 一 个 匹配 的 catch 子 句 处 继续 执行 ， 所 以 catch 子 句 表 中 的 顺序 是 很 重 
要 的 。 因 为 Java 代码 是 结构 化 的 ， 因 此 总 可 以 把 某 个 方法 中 所 有 的 异常 处 理 器 都 按 序 
排列 到 一 个 表 中 ， 对 任意 可 能 的 程序 计数 器 的 值 ， 都 可 以 用 线性 的 顺序 找到 合适 的 异 
常 处 理 块 ， 以 处 理 在 该 程序 计数 器 值 下 发 生 的 异常 情况 。 

口 ” 如 果 找 不 到 匹配 的 catch 子 句 ,那么 当前 方法 得 到 一 个 “未 截获 异常 ”的 结果 并 返回 到 
当前 方法 的 调用 者 ， 好 像 异常 刚刚 在 其 调用 者 中 发 生 一 样 。 如 果 在 调用 者 中 仍然 没有 
找到 相应 的 异常 处 理 块 ,那么 这 种 错误 传播 将 被 继续 下 去 。 如 果 错 误 被 传播 到 最 顶层 ， 
那么 系统 将 调用 一 个 缺 省 的 异常 处 理 块 。 

3) ”操作 数 栈 区 

机 器 指令 只 从 操作 数 栈 中 取 操 作 数 ， 对 它们 进行 操作 ， 并 把 结果 返回 到 栈 中 。 选 择 栈 结构 
的 原因 是 : 在 只 有 少量 寄存 器 或 非 通用 寄存 器 的 机 器 (如 Intel 486) 上 ， 也 能 够 高 效 地 模拟 虚拟 机 
的 行为 。 操 作 数 栈 是 32 位 的 ， 用 于 给 方法 传递 参数 ， 并 从 方法 接收 结果 ， 也 用 于 支持 操作 的 参 
数 ， 并 保存 操作 的 结果 。 例 如 ，iadd 指令 将 两 个 整数 相 加 。 相 加 的 两 个 整数 应 该 是 操作 数 栈 顶 
的 两 个 字 。 这 两 个 字 是 由 先前 的 指令 压 进 堆栈 的 。 这 两 个 整数 将 从 堆栈 弹出 、 相 加 ， 并 把 结果 
压 回 到 操作 数 栈 中 。 

每 个 原始 数据 类 型 都 有 专门 的 指令 对 它们 进行 必需 的 操作 。 每 个 操作 数 在 栈 中 需要 一 个 存 
储 位 置 ， 除 了 long 和 double 型 ， 它 们 需要 两 个 位 置 。 操 作 数 只 能 被 适用 于 其 类 型 的 操作 符 所 操 
作 。 例 如 压 入 两 个 int 类 型 的 数 ， 如 果 把 它们 当 作 是 一 个 long 类 型 的 数 则 是 非法 的 。 在 Sun 的 
虚拟 机 实现 中 ， 这 个 限制 由 字 节 码 验 证 器 强制 实行 。 但 是 有 少数 操作 (操作 符 dupe 和 swap)， 用 
于 对 运行 时 数据 区 进行 操作 时 是 不 考虑 类 型 的 。 


4. 无 用 单元 收集 堆 


Java 的 堆 是 一 个 运行 时 数据 区 , 类 的 实例 (对 象 ) 从 中 分 配 空间 。Java 语言 具有 无 用 单元 收集 
能 力 ， 即 它 不 给 程序 员 显 式 释放 对 象 的 能 力 。Java 不 规定 具体 使 用 的 无 用 单元 收集 算法 ， 可 以 
根据 系统 的 需求 使 用 各 种 各 样 的 算法 。 


5. 方法 区 


方法 区 与 传统 语言 中 的 编译 后 代码 或 是 Unix 进程 中 的 正文 段 类 似 。 它 保存 方法 代码 (编译 
后 的 java 代码 ) 和 符号 表 。 在 当前 的 Java 实现 中 ,方法 代码 不 包括 在 无 用 单元 收集 堆 中 ,但 Oracle 
公司 计划 在 将 来 的 版 本 中 实现 。 每 个 类 文件 包含 了 一 个 Java 类 或 一 个 Java 界面 的 编译 后 的 代码 。 
可 以 说 类 文件 就 是 Java 语言 的 执行 代码 文件 。 为 了 保证 类 文件 的 平台 无 关 性 ，Java 虚拟 机 规范 
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e 深入 理解 Android 虚拟 机 ~: 


中 对 类 文件 的 格式 也 作 了 详细 的 说 明 。 其 具体 细节 请 参考 Sun 公司 的 Java 虚拟 机 规范 。 


在 Java 虚拟 机 规范 中 ， 一 个 虚拟 机 实例 的 行为 是 分 别 按照 子 系统 、 内 存 区 、 数 据 类 型 以 及 


指令 这 几 个 术语 来 描述 的 。 这 些 组 成 部 分 一 起 展示 了 抽象 的 虚拟 机 的 内 部 抽象 体系 结构 。 但 是 
规范 中 对 它们 的 定义 并 非 要 强制 规定 Java 虚拟 机 实现 内 部 的 体系 结构 ， 更 多 的 是 为 了 严格 地 定 
义 这 些 实现 的 外 部 特征 。 规 范本 身 通过 定义 这 些 抽 象 的 组 成 部 分 以 及 它们 之 间 的 交互 ， 来 定义 
任何 Java 虚拟 机 实现 都 必须 遵守 的 行为 。 


存 


如 图 3-3 所 示 是 Java 虚拟 机 的 结构 框图 ， 包 括 在 Java 虚拟 机 规范 中 描述 的 主要 子 系统 和 内 
区 。 前 一 章 我 们 曾 提 到 ， 每 个 Java 虚拟 机 都 有 一 个 类 装载 器 子 系统 ， 会 根据 给 定 的 全 限定 名 


类 装 入 类 型 (类 或 接口 )， 同 样 ， 每 个 Java 虚拟 机 都 有 一 个 执行 引擎 ， 它 负责 执行 那些 包含 在 被 
装载 类 的 方法 中 的 指令 。 


1 
| native method 


1 
1 

! libraries 1 
1 


图 3-3 Java 虚拟 机 的 结构 框图 
当 Java 虚拟 机 运行 一 个 程序 时 ， 它 需要 使 用 内 存 来 存储 许多 东西 ， 例 如 下 面 所 示 的 元 素 。 
字 节 码 。 
从 已 装载 的 class 文件 中 得 到 的 其 他 信息 。 
程序 创建 的 对 象 。 
传递 给 方法 的 参数 。 
返回 值 。 
局 部 变量 。 
运算 的 中 间 结 果 。 
Java 虚拟 机 会 把 上 述 元 素 都 组 织 到 几 个 “运行 时 数据 区 ”中 ， 目 的 是 便于 管理 。 尽 管 这 些 


OOOOOODD 


“运行 时 数据 区 ”都 会 以 某 种 形式 存在 于 每 一 个 Java 虚拟 机 实现 中 , 但 是 Java 虚拟 机 规范 对 它 


们 
决 


的 描述 却 是 相当 抽象 的 。 这 些 运 行 时 数据 区 结构 上 的 细节 ， 大 多 数 都 由 具体 实现 的 设计 者 
定 。 
不 同 的 虚拟 机 实现 可 能 具有 不 同 的 内 存 限 制 ， 有 的 实现 可 能 有 大 量 的 内 存 可 用 ， 有 的 可 能 


只 有 很 少 ， 有 的 实现 可 以 利用 虚拟 内 存 ， 有 的 则 不 能 。 规 范本 身 对 “运行 时 数据 区 ”只 有 抽象 
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的 描述 ， 这 就 使 得 Java 虚拟 机 可 以 很 容易 地 在 各 种 计算 机 和 设备 上 实现 。 

某 些 运行 时 数据 区 是 由 程序 汇总 所 有 线程 共享 的 ， 有 些 则 只 有 由 一 个 线程 拥有 。 每 个 Java 
虚拟 机 实例 都 有 一 个 方法 区 以 及 一 个 堆 ， 它 们 是 由 该 虚拟 机 实例 中 所 有 线程 共享 的 。 当 虚拟 机 
装载 一 个 class 文件 时 ， 它 会 从 这 个 class 文件 所 包含 的 二 进 制 数据 中 解析 类 型 信息 。 然 后 ， 它 
把 这 些 类 型 信息 放 到 方法 区 中 。 当 程序 运行 时 ， 虚 拟 机 会 把 所 有 该 程序 在 运行 时 创建 的 对 象 都 
放 到 堆 中 。 如 图 3-4 所 示 是 对 这 些 内 存 区 域 的 描绘 。 


3-4 ”由 所 有 线程 共享 的 运行 时 数据 区 


当 每 一 个 新 线程 被 创建 时 , 它 都 将 得 到 自己 的 PC 寄存 器 (程序 计数 器 ) 以 及 一 个 Java 栈 : 如 
果 线 程 正在 执行 的 是 一 个 Java 方法 ( 非 本 地 方法 ), 那么 PC 寄存 器 的 值 将 总 是 指示 下 一 条 将 被 执 
行 的 指令 ， 而 其 Java 栈 则 总 是 存储 该 线程 中 Java 方法 调用 的 状态 一 一 包括 它 的 局 部 变量 , 被 调 
用 时 传 进来 的 参数 ， 它 的 返回 值 ， 以 及 运算 的 中 间 结 果 等 。 而 本 地 方法 调用 的 状态 ， 则 是 以 某 
种 依赖 于 具体 实现 的 方式 存储 在 本 地 方法 栈 中 的 ， 也 可 能 是 在 寄存 器 或 者 其 他 某 些 与 特定 实现 
相关 的 内 存 区 中 。 

Java 栈 是 由 许多 栈 帧 (stackframe) 或 者 说 帧 (frame) 组 成 的 ， 一 个 栈 帧 包含 一 个 Java 方法 调用 
的 状态 。 当 线程 调用 一 个 Java 方法 时 ， 虚 拟 机 压 入 一 个 新 的 栈 帧 到 该 线程 的 Java RP: 当 该 方 
法 返回 时 ， 这 个 栈 帧 被 从 Java 栈 中 弹出 并 抛弃 。 

Java 虚拟 机 没有 寄存 器 ， 其 指令 集 使 用 Java 栈 来 存储 中 间 数 据 。 这 样 设计 的 原因 是 为 了 保 
持 Java 虚拟 机 的 指令 集 尽量 紧凑 , 同时 也 便于 Java 虚拟 机 在 那些 只 有 很 少 通用 寄存 器 的 平台 上 
实现 ， 另 外 Java 虚拟 机 的 这 种 基于 栈 的 体系 结构 ， 也 有 助 于 运行 时 某 些 虚拟 机 实现 的 动态 编译 
器 和 即时 编译 器 的 代码 优化 。 

如 图 3-5 所 示 描 绘 了 Java 虚拟 机 为 每 一 个 线程 创建 的 内 存 区 ， 这 些 内 存 区 域 是 私有 的 ， 任 
何 线程 都 不 能 访问 另 一 个 线程 的 PC 寄存 器 或 者 Java Hi. 

图 3-5 展示 了 一 个 虚拟 机 实例 的 快照 ， 它 有 三 个 线程 正在 执行 。 线 程 1 和 线程 2 都 正在 执 
ff Java 方法 ， 而 线程 3 则 正在 执行 一 个 本 地 方法 。 在 图 3-5 中 ， 和 本 书 其 他 内 容 一 样 ，Java B 
都 是 向 下 生长 的 ， 而 栈 顶 都 显示 在 图 的 底部 ， 当 前 正在 执行 的 方法 的 栈 帧 则 以 浅 色 表示 ， 对 于 
一 个 正在 运行 Java 方法 的 线程 而 言 ， 它 的 PC 寄存 器 总 是 指向 下 一 条 将 被 执行 的 指令 。 在 图 3-5 
中 ， 像 这 样 的 PC 寄存 器 (比如 线程 1 和 线程 2 的 ) 都 是 以 浅 色 显示 的 。 由 于 线程 3 当前 正在 执行 
一 个 本 地 方法 ， 因 此 ， 其 PC 寄存 器 (以 深 色 显示 的 那个 ) 的 值 是 不 确定 的 。 
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图 3-5 ”线程 专 有 的 运行 时 数据 区 


3.24 Java 虚拟 机 的 生命 周期 


一 个 运行 时 的 Java 虚拟 机 实例 的 天 职 是 : 负责 运行 一 个 Java 程序 。 在 启动 一 个 Java 程序 
的 同时 会 诞生 一 个 虚拟 机 实例 ， 当 该 程序 退出 时 ， 虚 拟 机 实例 也 会 随 之 消亡 。 如 果 在 同一 台 计 
算 机 上 同时 运行 三 个 Java 程序 ， 则 会 得 到 三 个 Java 虚拟 机 实例 。 每 个 Java 程序 都 运行 在 它 自 
己 的 Java 虚拟 机 实例 中 。 
Java 虚拟 机 实例 通过 调用 某 个 初始 类 的 main0 方 法 来 运行 一 个 Java 程序 。 而 这 个 main0 方 
法 必须 是 公有 的 (public)、 静 态 的 (static)、 返 回 值 为 void， 并 且 接受 一 个 字符 串 数 组 作为 参数 。 
任何 拥有 这 样 一 个 main0 方 法 的 类 都 可 以 作为 Java 程序 运行 的 起 点 。 假 如 存在 这 样 一 个 Java 程 
序 ， 此 程序 能 够 打印 出 传 给 它 的 命令 行 参数 如 下 。 
package jvm.ext1; 
public class Echo ( 
public static void main(String[]args) { 
int length - args.length; 
for (int i = 0; i «length; i++) { 
System.out.print(args[i] +""); 


} 


System.out.println(); 


} 
} 


上 述 代 码 必 须 告诉 Java 虚拟 机 要 运行 的 Java 程序 中 初始 类 的 名 字 , 整个 程序 将 从 它 的 main0 
方法 开始 运行 。 现 实 中 一 个 Java 虚拟 机 实现 的 例子 如 SunJava 2 SDK 的 Java 程序 。 比 如 ， 如 果 
想 要 在 Windows 上 使 用 Java 来 运行 Echo 程序 ， 需 要 输入 如 下 命令 。 

java Echo Greetings, Planet 

该 命令 的 第 一 个 单词 “java”， 告 诉 操作 系统 应 该 运行 来 自 Sun Java 2 SDK 的 Java 虚拟 机 。 
第 二 个 词 *Echo” 则 支持 初始 类 的 名 字 。 Echo 这 个 初始 类 中 必须 有 个 公有 的 、 静 态 的 方法 main0， 
它 获得 一 个 字符 串 数组 参数 并 且 返 回 void。 上 述 命令 行 中 剩 下 的 单词 序列 “Greetings，Planet”， 
作为 该 程序 的 命令 行 参数 以 字符 串 数组 的 形式 传递 给 main0， 因 此 ， 对 于 上 面 这 个 例子 ， 传 递 
给 类 Echo 中 main() 方 法 的 字符 串 数组 参数 的 内 容 如 下 。 


args [0] 为 "Greetings," 
args [1] 为 "Planet .nm 
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Java 程序 初始 类 中 的 main0 方 法 ， 将 作为 程序 初始 线程 的 起 点 ， 其 他 任何 线程 都 是 由 这 个 
初始 线程 启动 的 。 

在 Java 虚拟 机 内 部 有 两 种 线程 : 守护 线程 与 非 守护 线程 。 守 护 线程 通常 是 由 虚拟 机 自己 使 
用 的 ， 比 如 执行 垃圾 收集 任务 的 线程 。 但 是 ，Java 程序 也 可 以 把 它 创 建 的 任何 线程 标记 为 守护 
线程 。 而 Java 程序 中 的 初始 线程 一 一 就 是 开始 与 main0 的 那个 ， 是 非 守护 线程 。 

只 要 还 有 任何 非 守护 线程 在 运行 ， 那 么 这 个 Java 程序 也 在 继续 运行 (虚拟 机 仍然 存活 )。 当 
该 程序 中 所 有 的 非 守护 线程 都 终止 时 ， 虚 拟 机 实例 将 自动 退出 。 假 若 安全 管理 器 允许 ， 程 序 本 
身 也 能 够 通过 调用 Runtime 类 或 者 System 类 的 exit 方法 来 退出 。 

在 上 面 的 Echo 程序 中 ， 方 法 main0 并 没有 调用 其 他 线程 。 所 以 当 它 打印 完 命令 行 参数 后 则 

返回 main0 方 法 。 这 就 终止 了 该 程序 中 唯一 的 非 守护 线程 ， 最 终 导 致 虚拟 机 实例 退出 。 


3.3 Android 虚拟 机 一 一 Dalvik VM 


Dalvik VM(VM 表示 虚拟 机 ) 是 Google 等 厂商 合作 开发 的 Android 移动 设备 平台 的 核心 组 成 
部 分 之 一 。 它 可 以 支持 已 转换 为 .dex( 即 Dalvik Executable) 格 式 的 Java 应 用 程序 。.dex 格式 是 专 
为 Dalvik 设计 的 一 种 压缩 格式 ， 适 合 内 存 和 处 理 器 速度 有 限 的 系统 。Dalvik 是 由 Dan Bornstein 
编写 的 ,名 字 来 源 于 他 的 祖先 曾经 居住 过 名 叫 Dalvik 的 小 渔村 。 大 多 数 虚拟 机 包括 JVM 都 是 一 
种 堆栈 机 器 ， 而 Dalvik 虚拟 机 则 是 基于 寄存 器 的 。 两 种 架构 各 有 优 劣 ， 一 般 而 言 ， 基 于 栈 的 机 
器 需要 更 多 的 指令 ， 而 基于 寄存 器 的 机 器 指令 更 大 。 


3.3.1 Dalvik 架构 


名 为 dx 工具 是 用 来 转换 Java class 成 为 DEX 格式 ， 但 不 是 全 部 。 多 个 类 型 包含 在 一 个 dex 
文件 之 中 。 多 个 类 型 中 重复 的 字符 串 和 其 他 常数 包括 会 存放 在 DEX 之 中 只 有 一 次 , 以 节省 空间 。 
Java 字 节 码 (betecode) 转 换 成 Dalvik 虚拟 机 所 使 用 的 替代 指令 集 。 一 个 未 压缩 dex 文件 通常 是 稍 
稍 小 于 一 个 已 经 压缩 .Jar 档 。 

再 次 安装 到 行动 设备 时 ， 可 能 会 被 已 经 修改 的 Dalvik 处 置 为 可 执行 的 文件 。 为 了 获得 进 一 
步 的 优化 ， 端 序 (byte ordeD 可 能 会 在 一 定 的 数据 交换 ， 简 单 的 数据 结构 和 函数 库 ， 可 内 联 (linked 
inline)， 空 的 类 型 对 象 可 能 会 短路 。 

当 Android 启动 时 ，Dalvik VM 会 监视 所 有 的 程序 (APK)， 并 且 创 建 依存 关系 树 ， 为 每 个 程 
序 优化 代码 并 存储 在 Dalvik 缓存 中 。Dalvik VM 第 一 次 加 载 后 会 生成 Cache 文件 ， 以 供 下 次 快 
速 加 载 ， 所 以 Dalvik VM 的 第 一 次 加 载 会 变 得 很 慢 。 

Dalvik 解释 器 采用 预先 算 好 的 Goto 地 址 ， 基 于 每 个 指令 集 OpCode， 都 固定 以 64bytes 为 
Memory Alignment。 这 样 可 以 节省 一 个 指令 集 OpCode 后 ， 要 进行 查 表 的 时 间 。 为 了 强化 功能 ， 
Dalvik 还 提供 了 Fast Interpreter. 

dx 是 一 套 工 具 , 可 以 将 Java 的 .class 文件 转换 成 .dex 格式 ,一 个 dex 文档 通常 会 有 多 个 .class 
文件 。 由 于 dex 有 时 必须 进行 优化 ， 会 使 文件 的 大 小 增加 1 一 4 倍 ， 并 以 ODEX 结尾 。 
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3.3.2 ”和 Java 虚拟 机 的 差异 


与 大 多 数 的 Java 虚拟 机 不 同 , 前 者 是 栈 机 (stack machine), 而 Dalvik VM 是 基于 寄存 器 的 架 
构 。 就 像 CISC 与 RISC 的 争论 ， 这 两 种 方式 的 相对 优点 是 一 个 不 断 争 论 的 话题 ， 且 有 时 技术 界 
限 会 变 得 模糊 不 清 。 此 外 ， 这 两 种 方法 的 相对 优势 取决 于 所 选择 的 解释 /编译 策略 。 但 是 ， 总 的 
来 说 ， 基 于 栈 的 机 器 必须 使 用 指令 来 载 入 栈 上 的 数据 ， 或 使 用 指令 来 操纵 数据 ， 因 此 与 基于 寄 
存 器 的 机 器 相 比 ， 需 要 的 指令 更 多 。 然 而 ， 在 寄存 器 的 指令 必须 编码 源 和 目的 地 寄存 器 ， 因 此 
往往 指令 更 大 。 
重复 的 、 可 用 于 多 个 类 的 字符 串 和 其 他 常量 在 转换 到 .dex 格式 时 输出 到 保留 空间 。Java 字 
节 码 还 可 转换 成 可 选择 的 Dalvik VM 使 用 的 指令 集 。 一 个 未 压缩 的 .dex 文件 在 文件 大 小 方面 往 
往 比 从 同样 的 .class 文件 压缩 成 的 jar 文件 更 小 。 

当 Dalvik 可 执行 文件 安装 到 移动 设备 时 ， 是 可 以 被 修改 的 。 为 了 进一步 的 优化 ， 在 某 些 数 
据 、 简 单数 据 结构 和 内 联 的 函数 库 中 的 字 节 顺序 可 以 互 换 ， 例 如 空 类 对 象 被 短路 。 

为 满足 低 内 存 要 求 而 不 断 优 化 ，Dalvik VM 有 一 些 独 特 的 、 有 别 于 其 他 标准 虚拟 机 的 特征 。 

(1) 虚拟 机 很 小 ， 使 用 的 空间 也 小 。 

(2) Dalvik VM 没有 JIT 编译 器 。 

(3) 常量 池 已 被 修改 为 只 使 用 32 位 的 索引 ， 以 简化 解释 器 。 

(4) 它 使 用 自己 的 字 节 码 ， 而 非 Java F. 

此 外 ，Dalvik VM 被 设计 来 满足 可 高 效 运行 多 种 虚拟 机 实例 。 

Android 的 应 用 程序 框架 为 应 用 程序 层 的 开发 者 提供 APIs， 它 实际 上 是 一 个 应 用 程序 的 框 
架 。 由 于 上 层 的 应 用 程序 是 以 JAVA 构建 的 ， 因 此 本 层次 提供 的 首先 包含 了 U 程序 中 所 需要 的 
各 种 控件 ， 例 如 : Views (视图 组 件 ) 包 括 lists( 列 表 )，grids( 栅 格 )，text boxes( 文 本 框 )，buttons( 按 
钮 ) 等 。 甚 至 一 个 嵌入 式 的 Web 浏览 器 。 

一 个 Andoid 的 应 用 程序 可 以 利用 应 用 程序 框架 中 的 以 下 几 个 部 分 。 

Q Activity: 活动 。 

Q Broadcast Intent Receiver: 广播 意图 接收 者 。 

O Service: 服务 。 

QU Content Provider: 内 容 提 供 者 。 

Q Application: 应 用 程序 。 

Android 的 应 用 程序 主要 是 用 户 界面 (User Interface) 方 面 的 ， 通 常 以 Java 程序 编写 ， 其 中 还 
可 以 包含 各 种 资源 文件 (放置 在 res 目录 中 )JAVA 程序 及 相关 资源 经 过 编译 后 ， 将 生成 一 个 APK 
包 。Android 本 身 提供 了 主屏 幕 (Home)、 联 系 人 (Contact)、 电 话 (Phone)、 浏 览 器 (Browers) 等 众多 
的 核心 应 用 。 同 时 应 用 程序 的 开发 人 员 还 可 以 使 用 应 用 程序 框架 层 的 API 实现 自己 的 程序 。 这 
也 是 Android 开源 的 巨大 潜力 的 体现 。 

Dalvik VM 和 Java 虚拟 机 的 差异 如 下 。 

口 Dalvik VM 早期 并 没有 使 用 JIT(Just-In-Time) 技 术 , 从 Android 2.2 版 本 开始 , Dalvik VM 

也 支持 JIT. 
口 Dalvik VM 有 自己 的 bytecode， 并 非 使 用 Java bytecode。 
口 Dalvik VM 基于 暂 存 器 (register)， 而 JVM 基于 堆栈 (stack)。 


@> 


第 3 章 虚拟 机 概述 


ū Dalvik VM 通过 Zygote 进行 Class Preloading, Zygote 会 完成 虚拟 机 的 初始 化 ,这 也 是 
与 Java 虚拟 机 的 不 同 之 处 。 


3.3.8 Dalvik VM 的 主要 特征 


在 Dalvik VM 中 ,一 个 应 用 中 会 定义 很 多 类 , 编译 完成 后 即 会 有 很 多 相应 的 .class 文件 , .class 
文件 间 会 有 不 少 元 余 的 信息 ; 而 .dex 文件 格式 会 把 所 有 的 .class 文件 内 容 整 合 到 一 个 文件 中 。 这 
TÉ, 除了 减少 整体 的 文件 尺寸 , VO 操作 , 也 提高 了 类 的 查找 速度 。 原 来 每 个 类 文件 中 的 常量 池 ， 
在 .dex 文件 中 由 一 个 常量 池 来 管理 。 

每 一 个 Android Ri Dalvik VM 实例 里 ， 而 每 一 个 虚拟 机 实例 都 是 一 个 独立 
的 进程 空间 。 虚 拟 机 的 线程 机 制 、 内 存 分 配 和 管理 、Mutex 等 都 是 依赖 底层 操作 系统 实现 的 。 
所 有 Android ea 4 个 Linux 线程 , 虚拟 机 因而 可 以 更 多 地 依赖 操作 系统 的 线程 调 
度 和 管理 机 制 。 

不 同 的 应 用 在 不 同 的 进程 空间 里 运行 ， 对 不 同 来 源 的 应 用 都 使 用 不 同 的 Linux 用 户 来 运行 ， 
可 以 最 大 限度 地 保护 应 用 的 安全 和 独立 运行 。 

Zygote 是 一 个 虚拟 机 进程 ， 同 时 也 是 一 个 虚拟 机 实例 的 孵化 器 ， 每 当 系统 要 求 执行 一 个 
Android 应 用 程序 ，Zygote 就 会 孵化 出 一 个 子 进程 来 执行 该 应 用 程序 。 这 样 做 的 好 处 显而易见 : 
Zygote 进程 是 在 系统 启动 时 产生 的 ， 它 会 完成 虚拟 机 的 初始 化 ， 库 的 加 载 ， 预 置 类 库 的 加 载 和 
初始 化 等 操作 ， 而 在 系统 需要 一 个 新 的 虚拟 机 实例 时 ，Zygote 通过 复制 自身 ， 最 快速 地 提供 一 
个 系统 。 另 外 ， 对 于 一 些 只 读 的 系统 库 ， 所 有 虚拟 机 实例 都 和 Zygote 共享 一 块 内 存 区 域 ， 这 样 
可 以 大 大 节省 内 存 开销 。 

相对 于 基于 堆栈 的 虚拟 机 实现 ， 基 于 寄存 器 的 虚拟 机 实现 虽然 在 硬件 通用 性 上 要 差 一些 
但 是 它 在 代码 的 执行 效率 上 却 更 胜 一 筹 。 在 基于 寄存 器 的 虚拟 机 里 ， 可 以 更 加 有 效 地 减少 元 余 
指令 的 分 发 和 减少 内 存 的 读 写 访问 。 


3.3.4 Dalvik VM 的 代码 结构 
Dalvik 是 Android 程序 的 java 虚拟 机 ， 代 码 保存 在 dalvik/ 目 录 下 ， 目 录 的 具体 结构 如 下 。 


|-- Android.mk 

|-- CleanSpec.mk 

|-- MODULE LICENSE APACHE2 
|-- NoTICE 

|-- README.txt 

|-- dalvikvm 虚拟 机 的 实现 库 
|-- dexdump 

|-- dexlist 

|-- dexopt 

|-- docs 

|-- dvz 

|-- ax 

|-- hit 

|-- libcore 

|-- libcore-disabled 
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|-- libdex 

|-- libnativehelper 使 用 JNI 调用 本 地 代码 时 用 到 这 个 库 
|-- run-core-tests.sh 

|-- tests 

|-- tools 


-- vm 
dalvik/ 目 录 的 效果 图 如 图 3-6 所 示 。 
留 gases ini au ge mM 包 dest 
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3-6 dalvik/ 目 录 的 效果 图 


Dalvik 虚拟 机 各 个 目录 的 具体 说 明 如 下 。 

O android.mk: 此 目录 是 虚拟 机 编译 的 makefile 文件 。 

口 dalvikvm: 此 目录 是 虚拟 机 命令 行 调用 入 口 文件 的 目录 ， 主 要 用 来 解释 命令 行 参 数 ， 
调用 库 函 数 接口 等 。 

O dexdump: 此 目录 是 生成 dex 文件 反 编 译 查看 工具 ， 主 要 用 来 查看 编译 出 来 的 代码 文 

件 是 否 正确 ， 查 看 编译 出 来 的 文件 结构 怎么 样 。 

dexlist: 此 目录 是 生成 查看 dex 文件 里 所 有 类 的 方法 的 工具 。 

dexopt: 此 目录 是 生成 dex 优化 工具 。 

docs: 此 目录 是 保存 Dalvik VM 相关 帮助 文档 。 

dvz: 此 目录 是 生成 从 Zygote 请 求生 成 虚拟 机 实例 的 工具 。 

dx: 此 目录 是 生成 从 Java 字 节 码 转换 为 Dalvik 机 器 码 的 工具 。 

hit， 此 目录 是 生成 显示 堆栈 信息 /对 象 信息 的 工具 。 

libcore: 此 目录 是 Dalvik VM 的 核心 类 库 ， 提 供给 上 层 的 应 用 程序 调用 。 

libcore-disabled: 此 目录 是 一 些 禁用 的 库 。 

libdex: 此 目录 是 生成 主机 和 设备 处 理 .dex 文件 的 库 。 

libnativehelper: 此 目录 是 Dalvik 虚拟 核心 库 的 支持 库 函 数 。 

MODULE LICENSE APACHE2: 这 个 是 APCHE2 的 版 权 声明 文件 。 

NOTICE: 此 文件 是 说 明 虚 拟 机 源码 的 版 权 注 意 事项 。 

README.txt: 此 文件 是 说 明 本 目录 相关 内 容 和 版 权 。 

run-core-tests.sh: 此 文件 是 用 来 运行 核心 库 测试 。 

tests: 此 目录 是 保存 测试 相关 测试 用 例 。 

tools: 此 目录 是 保存 一 些 编译 /运行 相关 的 工具 。 

vm: 此 目录 是 保存 虚拟 机 绝 大 部 分 代码 ， 包 括 读 取 指 令 读 取 、 指 令 执 行 等 。 


libeorelissbled 


DcoODOODDODDOCOCODCCCCOUD 


第 3 章 虚拟 机 概述 


3.4 Dalvik 控制 VM 详解 


Dalvik VM 支持 一 系列 的 命令 行 参数 (使 用 adbshell dalvikvm - help 命令 可 获取 命令 列表 )， 
不 可 能 通过 Android 应 用 运行 时 来 传递 任意 参数 ， 但 是 可 以 通过 特定 的 系统 参数 来 影响 虚拟 机 
行为 。 我 们 可 以 通过 setprop 来 设置 系统 特性 ， 使 用 shell 命令 的 语法 格式 如 下 : 


adbshell setprop «name» «value» 


在 运行 时 必须 重启 Android， 从 而 使 得 改变 生效 (adb shell stop: adb shell start)。 这 是 因为 ， 
这 些 设 定 在 Zygote 进程 中 处 理 ， 而 Zygote 是 一 个 最 早 启动 并 且 永 远 存 活 的 进程 。 

我 们 不 可 以 用 无 特权 用 户 的 身份 设 定 dalvik.* 参 数 及 重启 系统 , 可 以 在 用 户 调试 版 本 的 shell 
上 使 用 adb root 或 者 运行 su 命令 的 方式 来 获取 root 权限 ， 如 果 有 疑问 ， 可 以 通过 如 下 命令 告诉 
setprop 是 否 发 生 。 

adbshell getprop «name» 


如 果 不 想 在 设备 重启 之 后 特性 随 之 消失 ， 在 /data/localprop 上 加 上 一 行 如 下 命令 : 


«name»- «value» 


重启 之 后 这 样 的 改变 也 会 一 直 存 在 ， 但 是 如 果 data 分 区 被 擦 除了 就 消失 了 。 在 工作 台 上 创 
建 一 个 local.prop， 然 后 执行 adb push local.prop/data/ 命 令 ， 或 者 使 用 类 似 于 下 面 格式 的 命令 ， 注 
意 这 里 引号 很 重要 。 


adb shell "echo name -value >> /data/local.prop" 


1. 扩展 的 JNI 检测 


JNI(Java Native Interface) 是 Java 本 地 接口 , 提供 了 Java 语言 程序 调用 本 地 (C/C++) 代 码 的 方 
ik. 扩展 的 INI 检测 会 引起 系统 运行 变 慢 ， 但 是 可 以 发 现 一 系列 讨厌 的 bug， 防 止 产生 问题 。 有 
两 个 系统 参数 影响 这 个 功能 ， 这 个 功能 可 以 通过 -Xcheck:jni 命令 行 参 数 来 激活 。 第 一 个 参数 是 
To.kermel.Android.checkjni， 这 是 通过 android 编译 系统 对 development 的 编译 来 设置 的 (也 可 以 通 
过 android 模拟 器 设置 ， 除 非 通过 模拟 器 命令 行 放置 了 -nojni 标志 位 )。 因 为 这 是 一 个 ro. 特 性 ， 
设备 启动 之 后 参数 就 不 能 变 了 。 

为 了 能 触发 CheckJNI 标志 位 ， 第 二 种 特性 是 dalvik.vm.checkjni， 它 的 值 覆 盖 了 
ro.kernel.Android.checkjni 的 值 。 如 果 这 个 特性 没有 被 定义 ，dalvik.vm.checkjni 也 没有 设置 成 false， 
那么 -Xcheck:jni 标志 位 就 没有 传 入 ，JNI 检测 也 就 没有 使 能 。 

要 打开 JNI 检测 ， 可 以 使 用 以 下 命令 实现 : 


adbshell setprop dalvik.vm.checkjni true 


也 可 以 通过 系统 特性 将 INI 检测 选项 传递 给 虚拟 机 ，dalvik.vm.jniopts 的 值 可 以 通过 -Xijniopts 
参数 传 入 ， 命 令 如 下 。 


adb shellsetprop dalvik.vm.jniopts forcecopy 
2. 断言 
Dalvik VM 支持 Java 编程 语言 的 断言 表达 式 , 默认 它 是 关闭 的 , 但 是 可 以 通过 如 下 -ea 参数 
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的 方式 设置 dalvik.vm.enableassertions 特性 。 


dalvikvm -ea.. 


这 个 参数 在 其 他 桌面 虚拟 机 中 同样 生效 ， 通 过 提供 class 4. package 名 (后 跟 “...”)， 或 者 
特殊 值 “all”。 命 令 如 下 。 


adbshell setprop dalvik.vm.enableassertion all 


就 可 以 在 所 有 非 系统 class 中 使 能 断言 。 这 个 系统 特性 比 全 命令 行 更 受 限制 , 不 可 以 通过 -ea 
入 口 设置 更 多 ， 而 且 没 有 指定 -da 入 口 的 方法 ， 而 且 未 来 也 没有 -esa/-dsa 等 价 的 东西 。 


3. 字 节 码 校 验 和 优化 


系统 尝试 预 校 验 .dex 文件 中 的 所 有 类 ， 从 而 降低 class 的 负担 ， 从 而 可 以 使 用 一 系列 的 优化 
来 提升 运行 性 能 。 这 些 都 是 通过 dexopt 命令 来 实现 的 ， 不 论 是 在 编译 系统 中 还 是 在 安装 上 。 在 
开发 设备 上 ，dexopt 可 能 在 dex 文件 第 一 次 被 使 用 时 运行 ， 而 不 论 它 或 者 它 的 依赖 是 否 更 新 过 
(Just-in-time 优化 和 校 验 ，JIT)。 

有 两 个 命令 行 标志 位 控制 JIT 优化 和 校 验 ，-Xverify 和 -Xdexopt。Andorid 框架 基于 
dalvik.vm.dexopt-flags 特性 来 配置 这 俩 参数 ， 如 果 你 设 定 


adbshell setprop dalvik.vm.dexopt-flags v-a o-v 


那么 Android 框架 会 将 -Xverify:all-Xdexopt:verified 传递 给 虚拟 机 ， 这 将 使 能 校 验 并 且 只 优化 校 
验 成 功 的 class。 这 是 最 安全 的 设 定 ， 也 是 默认 的 。 

另外 也 可 以 设 定 dalvik.vm.dexopt-flags v=n 使 得 框架 传输 -Xverify:none - Xdexopt:verified 
从 而 不 使 能 校 验 ( 可 以 传输 -Xdexopt:all 从 而 允许 优化 , 但 是 这 并 不 能 优化 更 多 代码 ， 因 为 没有 通 
过 校 验 的 class 可 能 被 优化 器 以 同样 的 理由 跳 过 )。 这 时 class 不 会 被 dexopt 校 验 ， 而 没 被 校 验 的 
代码 很 大 难以 执行 。 

使 能 校 验 会 使 得 dexopt 命令 明显 花费 更 多 时 间 ， 因 为 校 验 过 程 相 对 较 慢 ， 一 旦 校 验 和 优化 
过 的 dex 文件 准备 就 绪 ， 校 验 就 不 会 占用 额外 的 开销 ， 除 非 在 加 载 预 校 验 失败 的 class。 

如 果 dex 文件 的 校 验 关闭 了 ， 而 后 来 又 打开 了 校 验 器 ， 则 应 用 的 加 载 会 明显 变 慢 ( 大 概 40% 
以 上 ) 因 为 class 会 在 第 一 次 被 调用 的 时 候 校 验 。 

为 了 最 佳 效果 ， 当 特性 变化 时 应 该 为 dex 文件 强制 重新 调用 dexopt， 即 


adbshell "rm /data/dalvik-cache/*" 
它 删除 了 和 暂 存 的 dex 文件 ， 记 住 要 中 止 再 打开 运行 时 (adb shell stop: adb shell start). 


注意 : 老 的 版 本 支持 布尔 型 的 dalvik.vm.verify-bytecode 特性 ， 但 是 被 dalvik.vm.dexopt-flags 替 
NIMES 


4. Dalvik 的 运行 模式 


当前 Dalvik VM 的 实现 包括 三 个 独立 的 解释 内 核 : “快速 ”(fast)、“ 可 移植 ”(portable)、 
“调试 ”(debug)。 人 快速 解释 器 是 为 当前 平台 优化 的 ， 可 能 包括 手动 优化 的 汇编 文件 ， 相 对 的 ， 
可 移植 解释 器 是 用 C 语言 写 的 ， 可 在 广泛 的 平台 上 使 用 ， 调 试 解释 器 是 可 移植 解释 器 的 变种 ， 
包括 了 支持 程序 分 析 (profiling) 和 单 步 。 
Dalvik VM 可 能 也 支持 just-in-time 编译 ， 严 格 地 说 它 并 不 是 另 一 个 解释 器 ，JIT 编译 器 也 可 
Q^ 
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以 被 同样 的 标志 为 使 能 /不 使 能 。 通 过 dalvik - help 的 输出 信息 可 以 查看 JIT 编译 器 是 否 在 虚拟 
机 里 面 使 能 。 

Dalvik VM 人 允许 用 户 通过 使 用 -Xint 参数 的 扩展 在 快速 、 可 移植 和 JIT 中 选择 ， 该 参数 的 值 
可 以 通过 dalvik.vm.execution-mode 系统 特性 来 设置 。 为 了 选择 可 移植 解释 器 ， 命 令 如 下 。 


adb shell setpropdalvik.vm.execution-mode int:portable 


如 果 没 有 指定 该 参数 ， 系 统 会 自动 选择 最 合适 的 编译 器 ， 有 时 候 机 器 可 能 允许 选择 其 他 模 
式 ， 例 如 JIT 编译 器 。 

不 是 所 有 的 平台 都 有 优化 的 实现 ， 有 时 ， 快 速 编译 器 是 由 一 系列 的 实现 的 ， 这 个 结果 会 
比 可 移植 编译 器 还 慢 。 当 我 们 对 所 有 流行 平台 都 有 优化 版 本 时 ， 这 个 命名 (快速 ) 就 更 准确 了 。 

如 果 程 序 分 析 使 能 或 者 调试 器 连接 了 ，Dalvik VM 会 变 为 调试 解释 器 。 当 程序 分 析 结 束 或 
者 调试 器 中 断 连接 ， 就 会 恢复 原来 的 解释 器 。 用 调试 解释 器 会 明显 变 慢 ， 这 是 在 评估 数据 时 要 
记 住 的 。 

JIT 编译 器 可 以 通过 在 应 用 程序 AndroidManifestxml 中 加 入 android:vmSafeMode= “true” 
来 不 使 能 ， 当 怀疑 JIT 编译 器 会 使 应 用 运行 不 正常 时 可 以 使 用 这 个 命令 。 


5. 死 锁 预测 


如 果 虚 拟 机 以 WITH DEADLOCK PREDICTION 参数 编译 ， 那 么 死 锁 预测 器 会 在 
-Xdeadlockpredict 参数 中 使 能 。(dalvikvm - help 会 显示 虚拟 机 是 否 编译 正确 一 一 在 Configured 
中 按 行 查找 deadlock_prediction) 这 个 特性 会 让 虚拟 机 一 直 跟 踪 对 象 的 锁 获取 的 顺序 , 如 果 程 序 试 
图 以 与 之 前 看 到 不 同 的 顺序 获取 一 些 锁 ， 虚 拟 机 会 记录 一 个 警告 信息 并 有 选择 地 抛 出 异常 。 

命令 行 参数 是 基于 dalvik.vm.deadlock-predict 特性 设置 的 ， 正 确 的 值 是 off 表示 不 使 能 它 ( 默 
U), wan 表示 log 问题 但 是 继续 执行 ，err 表示 从 monitor-enter 指令 中 引发 一 个 
dalvik.system.PotentialDeadlockError 异常 ，abort 表示 终止 整个 虚拟 机 。 通 常 使 用 的 命令 如 下 。 

adbshell setprop dalvik.vm.deadlock-predict err 

在 当前 实现 中 ， 在 锁 被 获取 之 后 才 会 进行 计算 (这 减少 了 代码 ， 降 低 了 互 斥 信息 外 的 元 余 )。 
在 挂 起 的 进程 中 执行 Kill -3 时 可 以 发 现 一 个 死 锁 ， 并 且 可 以 在 日 志 信 息 中 检测 到 。 

这 仅仅 考虑 了 监督 程序 ， 本 地 的 互 斥 量 和 其 他 资源 也 会 引起 死 锁 ， 而 且 不 会 被 它 检 测 到 。 

6. dump 堆栈 追踪 

和 其 他 桌面 虚拟 机 一 样 ，Dalvik VM 收 到 SIGQUIT(Ctrl-\ 或 者 kill -3) 时 ， 会 为 所 有 的 现成 
dump 所 有 的 堆栈 追踪 。 它 默认 写 入 Android 的 日 志 ， 但 是 也 可 以 写 入 一 个 文件 。 

dalvik.vm.stack-trace-file 特性 允许 你 指定 要 将 线程 堆栈 追踪 写 入 的 文件 名 ,如 果 不 存在 , 将 
创建 ， 新 的 信息 将 追加 到 文件 尾 ， 文 件 名 通过 -Xstacktracefile 参数 写 入 虚拟 机 ， 命 令 如 下 。 


adbshell setprop dalvik.vm.stack-trace-file /tmp/stack-traces.txt 
如 果 这 个 特性 没有 被 定义 ， 虚 拟 机 会 在 收 到 这 个 信号 时 将 堆栈 追踪 信息 写 入 Android log. 
7. dex 文件 和 校 验 


出 于 性 能 考虑 ， 优 化 过 的 .dex 文件 的 和 校 验 被 取消 了 ， 这 通常 叫 安全 ， 因 为 文件 是 在 设备 
上 产生 的 ， 并 且 拥有 禁止 修改 的 权限 。 
«Qo 
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但 是 如 果 设 备 的 存储 器 不 可 靠 ， 就 会 发 生 数据 损坏 ， 这 通常 表现 为 重复 的 虚拟 机 崩溃 。 为 
了 快速 诊断 这 种 失败 ， 虚 拟 机 提供 了 -Xcheckdexsum 参数 ， 如 果 设 置 了 该 参数 ,那么 在 内 容 被 使 
用 之 前 所 有 的 .dex 文件 都 会 进行 和 校 验 。 如 果 dalvik.vm.check-dex-sum 特性 被 使 能 ， 那 么 应 用 
框架 会 在 虚拟 机 创建 时 提供 这 个 参数 。 
为 了 使 能 额外 的 dex 和 校 验 ， 可 以 用 如 下 命令 。 


adbshell setprop dalvik.vm.check-dex-sum true 

不 正确 的 和 校 验 会 组 织 dex 数据 的 使 用 , 产生 错误 并 写 入 log 文件 , 如果 设备 曾经 出 现 过 这 
样 的 问题 ， 那 么 将 这 个 特性 写 入 /data/local prop 很 有 用 。 
JER: dexdump 工具 每 次 都 会 进行 dex 和 校 验 ， 它 也 可 以 用 于 检测 大 量 的 文件 。 

8. 产生 标志 位 

在 Honeycomb 版 本 中 引入 了 一 系列 的 汇编 ， 它 们 通过 标志 位 写 入 虚拟 机 。 

adb shell setprop dalvik.vm.extra-opts "flaglflag2 .. flagN" 

这 些 标志 位 之 间 用 空格 隔 开 。 我 们 可 以 指定 任意 多 的 标志 位 只 要 它们 在 系统 特性 值 的 长 度 
范围 内 ， 目 前 是 92 个 字符 。 

这 些 额外 的 标志 位 会 被 加 到 命令 行 的 底 端 意味 着 它们 会 覆盖 之 前 的 设 定 。 这 些 可 以 用 于 
例如 测试 不 同 的 -Xmx BE Android 框架 层 已 经 设 定 过 了 。 


3.5 Dalvik VM 架构 


在 Android 源码 中 ，Dalvik VM 的 实现 位 于 dalvik/ 目 录 下 ， 其 中 dalvik/vm 是 虚拟 机 的 实现 
部 分 , 将 会 编译 成 libdvm.so。 而 dalvik/libdex 将 会 编译 成 libdex.a 静态 库 , 作为 dex 工具 而 使 用 ; 
dalvik/dexdump 是 .dex 文件 的 反 编 译 工 具 , 虚拟 机 的 可 执行 程序 位 于 dalvik/dalvikvm 中 , 将 会 编 
译 成 dalvikvm 可 执行 文件 。 

Dalvik VM 的 架构 如 图 3-7 所 示 。 


Dalvik 虚 似 机 | 


Host OS(linux) 
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Android 应 用 的 编译 及 运行 流程 如 图 3-8 所 示 。 


Java 文 件 


Class 文 件 


AndroidManifesLXML Resource 文 件 


DX 工 具 


图 3-8 Android 应 用 的 编译 及 运行 流程 


3.5.4 Dalvik 的 进程 管理 


Dalvik 进程 管理 是 依赖 于 Linux 的 进程 体系 结构 的 ， 如 要 为 应 用 程序 创建 一 个 进程 ， 它 会 
使 用 Linux 的 fork 机 制 来 复制 一 个 进程 (复制 进程 往往 比 创建 进程 效率 更 高 )。 

Zygote 是 一 个 虚拟 机 进程 ， 同 时 也 是 一 个 虚拟 机 实例 的 贱 化 器 ， 通 过 init 进程 启动 。 首 先 
AXE System. Server(Android 绝 大 多 系统 服务 的 守护 进程 ， 它 会 监听 socket 等 待 请 求 命令 ， 
当 有 一 个 应 用 程序 启动 时 ， 就 会 向 它 发 出 请 求 ，Zygote 就 会 孵化 出 一 个 新 的 应 用 程序 进程 )。 每 
当 系统 要 求 执行 一 个 Android 应 用 程序 时 ，Zygote 就 会 运用 Linux 的 fork 进 制 产生 一 个 子 进程 
来 执行 该 应 用 程序 。 


3.5.2 Android 的 初始 化 流程 


Linux 中 进程 间 的 通信 方式 有 很 多 ， 但 是 Dalvik 使 用 的 是 信号 方式 来 完成 进程 间 通 信 。 
Android 的 初始 化 流程 如 图 3-9 所 示 。 
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Dalvik 虚拟 机 是 Android 的 专用 虚拟 机 , 我 们 可 以 通过 网 络 获取 其 源码 , 获取 之 后 我 们 可 以 
在 本 地 机 器 编译 并 调试 。 本 章 将 简要 讲解 编译 、 调 试 Dalvik 虚拟 机 的 基本 知识 ， 为 读者 步 入 本 
书后 面 知识 的 学 习 打 下 基础 。 


4.1 Windows 环境 编译 Dalvik 


Android Source 中 默认 的 Dalvik 编译 目标 是 ARM 平台 ， 只 能 在 模拟 机 或 者 仿真 机 上 运行 ， 
不 过 如 果 想 研究 它 的 基本 原理 ， 还 是 在 X86 平台 下 显得 方便 一 点 。 

(1) 如 果 使 用 Ubunut 的 话 ， 建 议 把 gcc 版 本 换 成 43， 通 过 “gcc -v” 命 令 即 可 查看 当前 的 
版 本 。 

sudo apt-get install gcc-4.3 g++-4.3 

sudo ln -s /usr/bin/gcc-4.3 /usr/bin/gcc 

sudo ln -s /usr/bin/g++-4.3 /usr/bin/g++ 

如 果 使 用 的 是 默认 的 4.4， 则 编译 时 的 要 求 会 更 严格 ， 可 能 会 出 现 如 下 错误 提示 。 


error: invalid conversion from 'const char*' to 'char*' 


Q) 在 源 代码 根 目录 下 运行 如 下 命令 。 


. build/envsetup.sh 
lunch 2 


此 步骤 的 功能 是 设置 编译 的 目标 平台 ， 默 认 的 平台 信息 如 下 。 
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HOST ARCH-x86 

HOST OS-linux 

HOST BUILD TYPE-release 
BUILD ID-OPENMASTER 


选用 上 述 平台 后 的 信息 如 下 。 


PLATFORM VERSION CODENAME-AOSP 
PLATFORM VERSION-AOSP 
TARGET PRODUCT-sim 
TARGET BUILD VARIANT-eng 
TARGET SIMULATOR-true 
TARGET BUILD TYPE-debug 
TARGET BUILD APPS- 
TARGET ARCH-x86 

HOST ARCH-x86 

HOST OS-linux 

HOST BUILD TYPE-release 
BUILD ID-OPENMASTER 


具体 需要 什么 平台 可 以 根据 文件 envsetup.sh 的 内 容 进行 选择 ， 本 书 在 此 选择 的 是 X86。 

(3) 编译 相对 应 的 模块 。 

Dalvik 虚拟 机 后 面 的 几 个 模块 是 虚拟 机 本 身 需 要 的 一 些 library， 比 如 extjar。 我 们 可 以 
make(Linux 中 的 一 个 命令 ) 所 有 的 模块 ， 不 过 这 样 会 消耗 太 多 的 时 间 ， 并 且 增 加 了 出 现 编译 错误 
的 可 能 性 。 如果 只 是 为 了 研究 Dalvik 的 移植 或 者 调试 , 上述 模块 基本 用 了 。 如果 没有 dexopt 项 ， 
在 运行 时 会 出 现 如 下 错误 : 

E/dalvikvm(1540):execv 

'mnt/hd/Android/out/debug/host/linux-x86/pr/sim/system/bin/dexopt' failed: No such file 

or directory 

这 是 因为 dexopt 是 对 .dex 文件 进行 优化 的 一 个 模块 ， 一 定 需要 生成 。 生 成 的 文件 在 源码 目 
录 下 的 out 文件 夹 内 。 可 以 用 如 下 命令 查找 Dalvik 虚拟 机 文件 。 

find . -name dalvikvm 

(4) 测试 hello 程序 。 

假设 用 Java 文件 hello.java 进行 测试 ， 此 文件 的 代码 如 下 。 

public class hello{ 

public static void main(String args[]) 


System.out.println("hello world"); 
) 
} 


将 文件 hellojava 和 文件 makefile 放 在 Android 源码 的 根 目录 下 ， 将 源码 挂 载 在 第 二 硬盘 的 
/mnt/hd/Android 目录 下 ， 这 样 会 得 到 如 下 结果 。 
Android SRC DIR := /mnt/hd/Android 
我 们 只 需 对 文件 目录 相应 改变 即 可 , 并 且 因为 Android 目录 下 已 有 一 个 Makefile, 为 了 避免 
冲突 ， 因 此 将 hello 程序 的 makefile 命名 为 HelloMakefile. 
«o 


入 理解 Android 虚拟 机 - 


HelloMakefile 的 内 容 如 下 。 


Android SRC DIR := /mnt/hd/Android 
Android dir dx - $(ANDROID SRC DIR)/out/host/linux-x86/bin/dx 
all: 

javac hello.java 

$(Android dir dx) --dex --output-hello.jar hello.class 
clean: 

erm *.jar *.class 


完成 上 述 步 又 后 ， 会 生成 两 个 文件 : hello.jar 和 hello.class. 
(5) 如 果 直 接 运 行 /mnt/hd/Android/out/debug/host/linux-x86/pr/sim/systemybin/dalvikvm -cp 


hello.jar hello， 则 会 出 现 以 下 错误 : 


E/dalvikvm( 4668): ERROR: must specify non-'.' bootclasspath 
W/dalvikvm( 4668): JNI CreateJavaVM failed 
Dalvik VM init failed (check log file) 


出 现 该 错误 的 原因 是 没有 加 载 虚拟 机 运行 的 一 些 相关 文件 ， 因 此 需要 一 个 脚本 文件 ， 命 名 


为 rund.sh， 内 容 如 下 。 


Q^ 


#!/bin/sh 

base-'pwd' 

# configure root dir of interesting stuff 
root=$base/out /debug/host /linux-x86/pr/sim/system 

export Android ROOT-$root 

# configure bootclasspath 

bootpath-$root/framework 

export 
BOOTCLASSPATH-$bootpath/core.jar:$bootpath/ext.jar:$bootpath/framework.jar:$bootpath 
/Android.policy.jar:$bootpath/services.jar 

# this is where we create the dalvik-cache directory; make sure it exists 
export Android DATA-/tmp/dalvik $USER 

mkdir -p $Android DATA/dalvik-cache 

exec gdb $root/bin/dalvikvm 


而 后 输入 以 下 命令 即 可 运行 gdb 程序 。 

./rund.sh 

然后 在 gdb 调试 下 输入 运行 以 下 参数 。 

set args -cp hello.jar hello 

接 下 来 设置 断 点 。 

b main 

接 下 来 就 可 以 单 步调 试 Dalvik 虚拟 机 了 ， 下 面 是 可 能 出 现 的 运行 结果 。 


gaoshou@gaosho-desktop:/mnt/hd/Android$ ./rund.sh 

GNU gdb (GDB) 7.1-Ubuntu 

Copyright (C) 2010 Free Software Foundation, Inc. 

License GPLv3+: GNU GPL version 3 or later «http://gnu.org/licenses/gpl.html» 
This is free software: you are free to change and redistribute it. 
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e- 


There is NO WARRANTY, to the extent permitted by law. Type "show copying" 
and "show warranty" for details. 

This GDB was configured as "i486-linux-gnu". 

For bug reporting instructions, please see: 

«http: //www.gnu.org/software/gdb/bugs/»... 

Reading symbols from /mnt/hd/Android/out/debug/host/linux-x86/pr/sim/system/bin/ 
dalvikvm...done. 

(gdb) set args -cp hello.jar hello 

(gdb) b main 

Breakpoint 1 at 0x8048822: file dalvik/dalvikvm/Main.c, line 142. 

(gdb) r 

Starting program: /mnt/hd/Android/out/debug/host/linux-x86/pr/sim/system/bin/dalvikvm 
-cp hello.jar hello 

[Thread debugging using libthread db enabled] 

Breakpoint 1, main (argc-4, argv=O0xbfffebd4) at dalvik/dalvikvm/Main.c:142 
142 { 

(gdb) c 

Continuing. 

[New Thread 0x1439b70 (LWP 4698)] 

[New Thread 0xlc3ab70 (LWP 4699)] 

Hello World! 

[Thread 0x1439b70 (LWP 4698) exited] 

[Thread 0xlc3ab70 (LWP 4699) exited] 

Program exited normally. 


4.2 GDB 调试 Dalvik 


在 4.1 节 中 ， 已 经 简要 地 讲解 了 在 Windows 环境 下 编译 并 运行 Dalvik 虚拟 机 的 过 程 。 接 下 
来 将 详细 讲解 编译 并 运行 Dalvik 虚拟 机 的 每 一 个 过 程 。 在 本 节 将 首先 讲解 用 GDB 方式 调试 
Dalvik 的 流程 。 


4.2.1 准备 工作 


在 使 用 GDB 启动 Dalvik 时 ， 需 要 设置 一 些 环 境 。 整 个 设置 过 程 比较 烦琐 ， 所 以 在 此 创建 
了 一 个 脚本 来 简化 这 些 过 程 ， 假 设 将 脚本 名 为 grund.sh， 放 于 Android 源码 根 目录 。 下 面 是 脚本 
的 具体 内 容 。 


#!/bin/sh 

base='pwd' 

root=$base/out /debug/host/linux-x86/pr/sim/system 
export ANDROID_ROOT=$root 

bootpath=$root /framework 

export 
BOOTCLASSPATH=$bootpath/core.jar:$bootpath/ext .jar:$bootpath/ framework. jar:$bootpath 
/android.police.jar 

export ANDROID DATA-/tmp/dalvik test 

mkdir -p $ANDROID DATA/dalvik-cache 

exec gdb $root/bin/dalvikvm 


«Qo 
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4.2.2 GDB 调试 C 程序 


GDB 方式 调试 Dalvik 的 过 程 和 其 调试 C 程序 的 具体 过 程 类 似 , 在 接 下 来 的 内 容 中 , 我 们 先 
讲解 在 Android 系统 中 使 用 GDB 调试 C 程序 的 过 程 。 在 此 假设 我 们 的 调试 环境 如 下 。 

O ”操作 系统 : Ubuntu 11.10 32bit。 

O Android 源码 版 本 : Android 4.0.3 r1. 

Q Emulator: Android 4.0.3. 

接 下 来 以 调试 Android 源码 自 带 的 “memtest” 程 序 为 例 ， 调 试 前 已 经 编译 过 一 次 Android 
源码 ， 编 译 目标 是 fall-eng。 在 此 略 过 如 何 编译 源码 ， 如 何 使 用 编译 得 到 的 镜像 启动 模拟 器 。 

1) ”准备 工作 

启动 模拟 器 : 


#emulator -system ~/system.img -data ~/userdate.img -ramdisk ~/ramdisk.img -kernel 
~/kernel-qeum-armv7 


2) ”安装 没有 被 strip 的 memtest 到 模拟 器 

使 用 GDB 调试 程序 ， 则 被 调试 程序 必须 带 有 调试 信息 ，Android 编译 源码 时 默认 带 有 调试 
信息 , 但 是 最 后 生成 的 系统 文件 中 的 程序 和 库 还 是 会 被 strip, 但 是 out 目录 里 面 还 是 存放 了 带 有 
调试 信息 的 程序 。 

在 此 假设 我 们 已 经 执行 了 一 次 源码 编译 ， 那 么 源码 自 带 的 memtest 程序 也 会 被 编译 。 存 放 
memtest 的 源码 路 径 如 下 。 

~/source_code/system/extras/tests/memtest 

编译 后 没有 strip 的 可 执行 程序 路 径 如 下 。 

~/source_code/out/target/product/generic/obj/EXECUTABLES/memtest intermediates/LINKED/ 

进入 到 上 述 目录 ， 将 memtest 程序 push 到 模拟 器 /data/bin 下 (事先 在 data 下 建立 bin 目录 )。 

#adb push memtest /data/bin 

3) ”启动 gdbserver 


我 们 编译 出 来 的 系统 都 已 经 自 带 了 gdbserver, 如果 没有 , 可 以 在 prebuilt 里 面 找 到 编译 好 的 
并 安装 上 去 。 此 处 是 直接 在 adb shell 中 启动 gdbserver: 


#gdbserver :1234 /data/bin/memtest 

如 果 正 常会 显示 如 下 内 容 。 

Process /data/bin/memtest created; pid = 571 
Listening on port 1234 

4) ”启动 arm-eabi-gdb 进行 调试 

然后 在 另 一 个 终端 里 面 启动 gdb 客户 端 ， 具 体 过 程 如 下 。 
(1) 首先 设置 模拟 器 端口 转发 。 


#adb forward tcp:1234 tcp:1234 
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Q) 然后 启动 arm-eabi-gdb。 
在 Android 源码 的 prebuilt/linux-86/toolchain/arm-eabi-4.4.3/bin 下 面 有 这 个 程序 ， 当 然 也 可 
以 选择 其 他 版 本 的 gdb， 其 中 用 ARGC 表示 程序 参数 。 


# ~/source code/prebuilt/linux-86/toolchain/arm-eabi-4.4.3/bin/arm-eabi-gdb -/source code/ 
out/target/product/generic/obj/EXECUTABLES/memtest intermediates/LINKED/memtest 
[args] 


正常 启动 后 会 显示 下 面 的 信息 。 


GNU gdb (GDB) 7.1-android-gg2 

Copyright (C) 2010 Free Software Foundation, Inc. 

License GPLv3«: GNU GPL version 3 or later «http://gnu.org/licenses/gpl.html» 
This is free software: you are free to change and redistribute it. 

There is NO WARRANTY, to the extent permitted by law. Type "show copying" 
and "show warranty" for details. 

This GDB was configured as "--host-x86 64-linux-gnu --target-arm-elf-linux". 
For bug reporting instructions, please see: 

«http: //www.gnu.org/software/gdb/bugs/»... 

Reading symbols from /work dir/android4.0.3/out/target/product/generic/obj/EXECUTABLES / 
memtest intermediates/LINKED/memtest...done. 

(gdb) 


(3) 执行 set solib-xxx 如 下 两 个 命令 ， 建 立 符号 链接 。 
(gdb) set solib-absolute-prefix ~ /out/target/product/generic/symbols/ 
(gdb) set solib-search-path -/out/target/product/generic/symbols/system/lib/ 
(4) 通过 如 下 命令 连接 gdbserver 进行 调试 。 
(gdb) target remote :1234 
如 果 成 功 则 会 显示 如 下 内 容 。 


Remote debugging using :1234 

Reading symbols from /work dir/android4.0.3/out/target/product/generic/symbols/ system/ 
bin/linker...done. 

Loaded symbols for /work dir/android4.0.3/out/target/product/generic/symbols/system/ 
bin/linker 

. dl start () at bionic/linker/arch/arm/begin.S:35 

35 mov r0, sp 

(gdb) 


而 另 一 个 控制 台 会 显示 如 下 内 容 。 
Remote debugging form host 127.0.0.1 
而 没 执行 set solib-X X X 的 两 个 命令 会 显示 如 下 信息 。 


warning: Unable to find dynamic linker breakpoint function. 
GDB will be unable to debug shared library initializers 
and track explicitly loaded dynamic code. 

0xb0000100 in ?? () 


5) ”最 后 终于 可 以 进行 GDB 调试 了 
GDB 调试 工具 是 基于 命令 行 的 ， 调 试 命令 可 以 参考 如 下 连接 。 
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http://blog.csdn.net/dadalan/article/details/3758025 


设置 断 点 命令 breakpoint n E b n, n 表示 程序 行 号 或 是 函数 名 称 , 例如 在 main0 函 数 处 打上 


Wii. 


(gdb) b main 
Breakpoint 1 at 0xa504: file system/extras/tests/memtest/memtest.cpp, line 107. 


从 断 点 开始 继续 执行 continue 或 c。 


(gdb) c 
Continuing. 
Breakpoint 1, main (argc-1, argv-0xbea51c84) 
at system/extras/tests/memtest/memtest .cpp:107 
107 if (argc == 1) { 


然后 单 步 执行 next 或 n。 


(gdb) n 

106 ( 

(gdb) n 

107 if (argc == 1) { 
(gdb) n 

108 usage(argv[0]); 
(gdb) n 

107 return 0; 


打印 变量 值 : print param 或 p param, J param 表示 变量 名 ， 例 如 打印 arge 的 值 。 


(gdb) p argc 
$1-1 


GDB 的 调试 过 程 包含 很 多 命令 ， 含 有 很 多 有 用 的 命令 ， 查 看 当前 运行 程序 的 源码 list 或 1， 


查看 函数 堆栈 bt， 查 看 断 点 信息 info break， 设 置 观察 点 watch， 退 出 gdb: q， 终 止 程序 killo 


程序 调试 运行 完 后 ， 启 动 gdbserver 的 客户 端 会 打印 程序 的 运行 结果 ， 并 停止 server， 如 果 


要 重新 开始 调试 ， 不 要 忘 了 先 启动 gdbserver， 再 启动 gdbclient。 


注意 ; 在 此 只 介绍 了 Android GDB 简单 的 使 用 方法 ， 还 有 很 多 东西 可 以 研究 ， 例 如 调试 动态 库 
s0。 读 者 可 以 相关 资料 ， 继 续 进 行 研究 。 


4.2.3 GDB 调试 Dalvik 


GDB 调试 Dalvik 的 基本 流程 如 下 。 
(1) 准备 一 个 简单 的 Java 程序 ， 如 hello.java， 编 译 后 将 hello.jar 复制 至 Android 源码 根 


目录 。 


Q^ 


Q) 进入 到 Android 源码 根 目录 。 

(3) ./grund.sh， 执 行 此 脚本 ， 之 后 会 看 到 gdb 提示 符 。 
(4) 在 gdb 提示 符 后 输入 如 下 内 容 。 

set args -cp hello.jar hello 
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这 时 候 就 可 以 设置 断 点 ， 进 行 单 步 跟踪 了 。 其 中 main0 函 数 为 入 口 函 数 ， 先 在 文件 main.c 
的 212 行 设置 断 点 ， 即 在 gdb 提示 符 后 输入 “b 212”。 

(5) 在 gdb 提示 符 后 输入 “r”， 此 时 会 看 到 Dalvik 被 gdb 启动 执行 ， 然 后 停 于 212 行 ， 执 
47 INI_CreateJavaVMO MAHI EA gDvm 的 内 容 (输入 p gDvm). 然 后 执行 JINI CreateJavaVM() 
函数 (输入 “n”)， 再 查看 gDvm 的 内 容 。 对 比 执行 前 后 的 变化 ， 可 大 概 知道 JNI_CreateJavaVMO 
函数 所 做 的 事情 。 

(6) 文件 main.c 的 249. 行 代码 用 于 加 载 hello.class 文件 , 在 249 行 设 置 断 点 。 在 此 中 断后 ， 
查看 slashClass 的 内 容 (输入 “p slashClass”)，slashClass 正 是 “hello” 字 符 串 。 接 下 来 设置 单 步 
执行 (输入 “s”), 然后 查看 函数 调用 栈 (输入 “bt”)。 可知 现 在 正 执 行 的 是 文件 jni.c 中 的 FindClass() 
函数 。 通 过 此 方法 ， 可 知 函数 指针 指向 的 是 什么 函数 。 

(T) 文件 main.c 的 255 行 代码 的 功能 是 ,取得 文件 hellojava 中 main0 函 数 编译 后 的 字 节 码 。 
类 似 于 前 面 的 步 又 (6)， 可 知 此 时 执行 的 函数 为 文件 jni.c 中 的 GetStaticMethodIDO 函 数 。 

(8) 文件 main.c 的 273 行 代码 执行 main0 函 数 编译 后 的 字 节 码 ， 类 似 于 前 面 的 步 又 (6)， 可 
知 此 时 执行 的 函数 为 文件 jni.c 中 的 2681 行 。 此 处 为 宏 定 义 ， 不 容易 找到 。 但 通过 GDB 调试 ， 
可 以 准确 地 定位 。 如 此 时 继续 运行 程序 ，“hello world” 就 会 出 现在 我 们 的 眼前 。 


4.3 使 用 dexdump 


dexdump 是 Android 为 我 们 提供 的 一 个 工具 ， 其 最 大 的 功能 是 反 编 译 查看 APK 文件 。 在 
Android 虚拟 机 的 主 目录 下 有 一 个 名 为 “dexdump” 的 文件 ， 在 此 保存 了 和 dexdump 相关 的 功能 
文件 ， 如 图 4-1 所 示 。 


libnativehelper 


hit | libcore 


MODULE LICENSE A... [OS NOTICE 
文件 文件 
E Wt 


run-core-tests. sh 
SH 文件 


KB 
图 4-1 dexdump 文件 夹 


4.3.1 dexdump 的 反 编 译 功 能 


dexdump 最 重要 的 功能 是 破解 反 编 译 Android 程序 ， 实 现 对 APK 文件 的 破解 。 当 前 反 编 译 


«Q 
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Android 程序 没有 什么 好 的 方法 ， 但 是 可 以 通过 dexdump 查看 APK 文件 中 dex 的 执行 情况 ， 可 
以 粗略 分 析出 原始 Java 代码 是 什么 样 的 和 Dot Net 中 的 Reflector 很 像 。Android 编译 器 生成 的 
java class 中 的 相关 内 容 都 放 到 了 dex 文件 中 ,为 什么 要 反 编译 APK 文 件 呢 ? 就 目前 来 看 , Android 
的 开放 度 还 很 低 ， 很 多 东西 只 有 反 编 译 官方 的 app 才 可 以 了 解 。 

对 于 软件 开发 人 员 来 说 ， 保 护 代码 安全 也 是 比较 重要 的 因素 之 一 ， 不 过 目前 来 说 Google 
Android 平台 选择 了 Java Dalvik 虚拟 机 的 方式 使 其 程序 很 容易 破解 和 被 修改 ， 首 先 APK 文件 其 
实 就 是 一 个 MIME 为 ZIP 压缩 包 ， 我 们 修改 ZIP 后 级 名 的 方式 可 以 看 到 内 部 的 文件 结构 ， 类 似 
Oracle JavaMe 的 Jar 压缩 格式 一 样 ， 不 过 区 别 在 于 Android 上 的 二 进 制 代码 被 编译 成 为 Dex 的 
字 节 码 ， 所 有 的 Java 文件 最 终 会 编译 进 该 文件 中 去 ， 作 为 托管 代码 既然 虚拟 机 可 以 识别 ， 那 么 
我 们 就 可 以 很 轻松 地 反 编译 。 所 有 的 类 调用 、 涉 及 到 的 方法 都 在 里 面体 现 到 ， 至 于 逻辑 的 执行 
可 以 通过 实时 调试 的 方法 来 查看 ， 当 然 这 需要 借助 一 些 我 们 自己 编写 的 跟踪 程序 。 

使 用 UltraEdit 等 工具 进行 反 编译 的 流程 如 下 。 

(1) 首先 找到 Android 软件 安装 包 中 的 class.dex， 把 APK 文件 改名 为 “.zip”， 然 后 解压 缩 
其 中 的 class.dex 文件 ， 这 是 Java 文件 编译 再 通过 dx 工具 打包 成 的 ， 所 以 现在 我 们 就 用 上 述 提 
到 的 工具 来 逆 方 向 导出 java 源 文件 。 

Q) 把 class.dex 复制 到 dex2jar.bat 所 在 目录 。 

运行 dex2jar.bat classes.dex， 生 成 classes.dex.dex2jar.jar。 

(3) 运行 了 p-GUI 工具 , 这 是 绿色 无 须 安装 的 工具 。 打开 上 面 的 jar 文件 ， 即 可 看 到 源 代码 。 

把 APK 的 class.dex 备份 出 来 的 基本 流程 如 下 。 

© 用 winrar 或 者 winzip 打开 APK， 直 接 拖 出 来 。 

Q) H Android sdk 1.1 以 上 版 本 的 一 个 Dexdump 工具 把 class.dex 文件 dump 成 文本 。 把 刚 
才 的 class.dex 文件 放 在 和 dexdump 工具 相同 的 目录 ， 并 用 命令 窗口 执行 如 下 命令 。 


dexdump.exe -d classes.dex > spk.dump.txt 


此 命令 的 意思 是 将 classes.dex 文件 备份 出 来 形成 一 个 txt 文件 。 

下 一 步 就 要 读 懂 这 个 txt 文件 了 , 先 从 header 中 可 以 看 清楚 这 个 应 用 的 总 体 信 息 , 有 几 个 类 ， 
包括 内 部 类 ，header 只 是 了 解 概况 。 要 详细 分 析 下 面 的 每 一 个 class 才能 真正 理解 这 个 软件 的 设 
计 过 程 。 最 好 的 方法 是 一 边 研究 里 面 的 opcode 一 边 打开 api， 查 看 里 面 调用 到 的 类 和 方法 ， 减 
少 误解 的 概率 。 

opcode 就 是 介 于 高 级 编程 语言 和 二 进 制 代码 之 间 的 一 层 中 间 码 ，operationcode MRETI 
W opcode 主要 是 熟悉 里 面 的 逻辑 跳 转 以 及 一 些 个 别 助 记 符 的 含义 .通过 opcode 你 就 可 以 清晰 
地 知道 软件 里 面 每 个 方法 资源 的 调用 过 程 和 逻辑 跳 转 过 程 。 


4.3.2 使 用 dexdump 查看 jar 文件 
dexdump 可 执行 文件 放 于 out 目录 下 ， 可 以 使 用 “find out/ -name dexdump ”命令 来 找到 


dexdump. 
口 dexdump -f hellojar 命令 : 可 以 打印 jar 文件 的 头 部 信息 。 
口 dexdump -dhellojar: 可 以 打印 所 编译 的 字 节 码 。 
其 中 头 部 信息 如 下 : 


Q^ 


Opened 'hello.jar', 
DEX file header: 


DEX version '035' 


magic 'dex 

035" 

checksum : f2f85a9c 
signature : 0404...7831 
file size : 740 

header size 112 

link size :0 

link off : 0 (0x000000) 
string ids size : 14 

string ids off : 112 (0x000070) 
type ids size ER 
type_ids_off : 168 (0x0000a8) 
field ids size Bog 

field ids off : 232 (0x0000e8) 
method ids size EX 

method ids off : 240 (0x0000f0) 
class defs size zu 


class defs off 
data size 
data off 


: 272 (0x000110) 


: 304 (0x000130) 
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在 上 述 信息 中 ， 其 中 string ids. type ids. field ids, method ids、class_defs 皆 可 以 理解 为 


索引 。 通 过 这 些 索引 ， 可 以 查 到 真正 的 数据 存放 位 置 。Data_off 表示 真正 的 数据 存放 位 置 。 


对 应 的 字 节 码 信息 如 下 : 
#1 : (in Lhello;) 
name : 'main' 
type : '([Ljava/lang/String;)V' 
access : 0x0009 (PUBLIC STATIC) 
code = 
registers Gee) 
ins geal 
outs :2 


insns size : 10 16-bit code units 
000148:|[000148] hello.main: ( [Ljava/lang/String;)V 
000158: 6200 0000 |0000: sget-object v0, 
Ljava/lang/System;.out:Ljava/io/PrintStream; // field@0000 
00015c: 1a01 0900 |0002: const-string v1, 
"hello world" // string@0009 
000160: 6e20 0200 1000 |0004: invoke-virtual {v0, v1}, 
Ljava/io/PrintStream; .println: (Ljava/lang/String;)V // method@0002 
000166: 2a00 0000 0000 |0007: goto/32 #00000000 
catches : (none) 
positions 
0x0000 line=4 
0x0007 line=5 
locals 
Virtual methods - 
source_file_idx : 10 (hello.java) 


«Q 
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在 此 读者 需要 注意 的 是 ,在 文件 OpCodeNames.c 中 定义 了 Dalvik 虚拟 机 可 以 支持 的 大 约 230 
多 个 指令 集 OpCode, 其 中 也 包含 部 分 由 Dexopt 插 入 到 ByteCod 执行 当中 , 但 目前 尚未 在 Android 
文件 Bytecode for the Dalvik VM 说 明 的 OpCode 指令 。 文 件 OpCodeNames.c 的 主要 代码 如 下 : 


static const char* gOpNames[256] = { 
/* 0x00 */ 
"nop", 
"move", 
"move/fromi6", 
"move/16", 
"move-wide", 
"move-wide/from16", 
"move-wide/16", 
"move-object", 
"move-object/froml6é", 
"move-object/16", 
"move-result", 
"move-result-wide", 
"move-result-object", 
"move-exception", 
"return-void", 
"return", 


/* 0x10 */ 
"return-wide", 
"return-object", 
"const/4", 

"const /16", 

"const", 
"const/highl6", 
"const-wide/16", 
"const-wide/32", 
"const-wide", 
"const-wide/high16", 
"const-string", 
"const-string/jumbo", 
"const-class", 
"monitor-enter", 
"monitor-exit", 
"check-cast", 

/* 0x20 */ 
"instance-of", 
"array-length", 
"new-instance", 
"new-array", 
"filled-new-array", 
"filled-new-array/range", 
"fill-array-data", 
"throw", 

"goto", 
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4.4 Dalvik 虚拟 机 编译 脚本 


因为 Dalvik 源码 目录 结构 并 不 复杂 , 所 以 其 编译 脚本 也 很 简单 , 主要 有 以 下 几 个 文件 组 成 。 
D dalvik/vm/Android.mk 

D dalvik/vm/ReconfigureDvm.mk 

D dalvik/vm/Dvm.mk 


4.4.4 Android.mk 文件 


和 Android 系统 里 其 他 的 模块 类 似 ，Dalvik 虚拟 机 也 是 以 Android.mk 作为 顶层 编译 配置 文 


件 或 者 入 口 的 ， 它 的 内 容 是 vm/Android.mk 文件 。 在 接 下 来 的 内 容 中 ， 将 简要 分 析 Android.mk 
的 具体 内 容 。 


Q) 先 看 下 面 的 代码 : 


# 
# Android.mk for Dalvik VM. 
# 
# This makefile builds both for host and target, and so the very large 
# swath of common definitions are factored out into a separate file to 
# minimize duplication. 
# 
If you enable or disable optional features here (or in Dvm.mk), 
rebuild the VM with: 


# 
# 
LÀ 
# make clean-libdvm clean-libdvm assert clean-libdvm sv clean-libdvm interp 
# make -j4 libdvm 

# 


上 述 代码 的 功能 是 ， 该 编译 文件 把 Dalvik 编程 成 两 部 分 : 宿主 机 和 目标 机 。 在 多 数 典 型 的 


配置 下 ， 宿 主机 就 是 Linux 编译 服务 器 ， 而 目标 机 就 是 移动 设备 。 为 了 减少 重复 ， 宿 主机 和 目 
标 机 都 需要 的 编译 配置 被 放 到 单独 的 文件 里 。 


LOCAL PATH:- $(call my-dir) 


(2) 和 多 数 模块 一 样 ， 接 下 来 把 Dalvik 源码 路 径 赋 值 给 LOCAL PATH 变量 ， 以 方便 后 面 


使 用 。 此 处 的 LOCAL PATH 应 该 就 是 dalvik/vm 目录 。 


# 

# Build for the target (device). 

# 

ifeq ($(TARGET_CPU_SMP) , true) 
target_smp flag := -DANDROID SMP=1 


else 

target smp flag := -DANDROID SMP-0 
endif 
host smp flag :- -DANDROID SMP-1 


# Build the installed version (libdvm.so) first 
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include $(LOCAL PATH) /ReconfigureDvm.mk 
# Overwrite default settings 

LOCAL MODULE TAGS :- optional 

LOCAL MODULE :- libdvm 

LOCAL CFLAGS += $(target smp flag) 
include $(BUILD SHARED LIBRARY) 


在 上 述 代 码 中 , 首先 编译 目标 机 。 先 是 根据 目标 机 是 否 支 持 SMP, 设置 变量 target smp flag. 
而 宿主 机 上 现在 绝 大 多 数 都 是 支持 SMP 的 ， 所 以 就 直接 复制 。 


4.4.2 ReconfigureDvm.mk 文件 


紧 接着 就 要 调用 脚本 ReconfigureDvm.mk。 从 名 字 我 们 不 难 猜 出 ， 该 脚本 是 用 来 为 Dalv 让 
VM 编译 初始 化 编译 环境 的 。 

(1) 接着 就 是 现实 Dalvik VM 在 宿主 机 上 最 终 会 被 编译 的 目标 了 。 这 是 一 个 名 为 “libdvm” 
的 共享 库 ， 我 们 可 以 在 编译 好 的 机 器 上 找到 它 。 


out/target/xxx/libs/libdvm.so 
# If WITH JIT is configured, build multiple versions of libdvm.so to facilitate 
# correctness/performance bugs triage 
ifeq ($(WITH JIT),true) 
# Derivation #1 
# Enable assert and JIT tuning 
include $(LOCAL_PATH) /ReconfigureDvm.mk 
# Enable assertions and JIT-tuning 
LOCAL_CFLAGS += -UNDEBUG -DDEBUG-1 -DLOG NDEBUG-1 -DWITH DALVIK ASSERT V 
-DWITH JIT TUNING $(target smp flag) 
LOCAL MODULE :- libdvm assert 
include $(BUILD SHARED LIBRARY) 
# Derivation #2 
# Enable assert and self-verification 
include $(LOCAL_PATH) /ReconfigureDvm.mk 
# Enable assertions and JIT self-verification 
LOCAL CFLAGS += -UNDEBUG -DDEBUG-1 -DLOG NDEBUG-1 -DWITH DALVIK ASSERT V 
-DWITH SELF VERIFICATION $(target smp flag) 
LOCAL MODULE :- libdvm sv 
include $(BUILD SHARED LIBRARY) 
# Derivation #3 
# Compile out the JIT 
WITH_JIT := false 
include $(LOCAL PATH) /ReconfigureDvm.mk 
LOCAL_CFLAGS += $(target_smp_flag) 
LOCAL_MODULE := libdvm_interp 
include $(BUILD SHARED LIBRARY) 
endif 


这 一 部 分 是 为 JIT 特有 的 。 当 系统 支持 TIT 编译 器 时 ，Dalvik VM 会 编译 如 下 三 个 额外 的 目 

标 共 享 库 ， 用 于 支持 dvm 的 开发 特性 。 
O libdvm_ assert: 用 来 打开 dvm 源码 中 的 断言 (assert)。 我 们 在 后 面 的 分 析 文 章 中 会 看 到 ， 
Dalvik VM 实现 中 大 量 使 用 断言 来 增加 运行 时 的 检查 。 当 打开 这 些 断 言 时 ， 任 何 断 言 
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检查 失败 都 将 直接 导致 Dalvik VM 异常 退出 。 我 们 从 trace file 就 能 够 找到 是 哪个 断言 
失败 ， 从 而 检查 出 可 能 存在 的 bug。 在 最 终 发 布 版 本 中 ， 断 言 会 被 关闭 ， 那 些 断 言 相 
当 于 空 语句 。 因 而 不 会 再 最 终 发 布 版 本 中 使 Dalvik VM 异常 退出 。 

口 libdvm sv: 功能 是 在 某 些 重要 时 刻 检查 当前 dvm 状态 没有 异常 。 我 们 在 后 面 的 文章 里 
会 详细 分 析 Dalvik VM 到 底 做 了 哪些 自我 检查 。 

O libdvm_interp: 用 来 关 掉 JIT， 而 编译 出 一 个 纯 解 释 器 实现 的 Dalvik VM 实例 。 这 样子 
我 们 就 可 以 检查 打开 JIT 后 行为 有 没有 出 现 和 解释 器 实现 的 Dalvik VM 有 行为 差异 。 

我 们 可 以 在 如 下 目录 里 找到 这 三 个 为 调试 生成 的 Dalvik VM 共享 库 。 

out/target/xxx/symbol/libs/ 

O BURIAL ANTEATER, MARAA CU ERO FAIR. 


# 

# Build for the host. 

# 

ifeq ($(WITH_HOST_DALVIK) , true) 


endif 

首先 是 清空 本 地 变量 内 容 : 

include $ (CLEAR VARS) 

然后 是 根据 编译 环境 设置 三 个 编译 变量 : 


# Variables used in the included Dvm.mk. 
dvm os :- $(HOST OS) 

dvm arch :- $(HOST ARCH) 

# Note: HOST ARCH VARIANT isn't defined. 
dvm arch variant :- $(HOST ARCH) 


这 三 个 变量 最 终 会 传 给 编译 器 。 它 们 会 引入 平台 特有 的 行为 。 因 为 宿主 机 不 必 支持 JIT, Br 


以 将 它 设置 为 false。 


Q^ 


WITH JIT :- false 

«span style-"color: rgb(153, 153, 153); font-family: 'Bitstream Vera Sans Mono', 'Courier 
New', monospace; line-height: 9px; white-space: pre; "»«strong»include $(LOCAL PATH) 
/Dvm.mk</strong></span> 


G) 接 下 来 根据 目标 平台 ， 有 选择 性 地 引入 编译 需要 的 库 。 


LOCAL SHARED LIBRARIES += libcrypto libssl libicuuc libicuii8n 
LOCAL LDLIBS := -lpthread -1dl 
ifeq ($(HOST OS),linux) 
4 need this for clock gettime() in profiling 
LOCAL LDLIBS «- -lrt 
endif 


# Build as a WHOLE static library so dependencies are available at link 

# time. When building this target as a regular static library, certain 

# dependencies like expat are not found by the linker. 

LOCAL WHOLE STATIC LIBRARIES += libexpat libcutils libdex liblog libnativehelper libz 
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# The libffi from the source tree should never be used by host builds. 
# The recommendation is that host builds should always either 
# have sufficient custom code so that libffi isn't needed at all, 
# or they should use the platform's provided libffi. So, if the common 
# build rules decided to include it, axe it back out here. 
ifneq (,$(findstring libffi,$ (LOCAL SHARED LIBRARIES))) 

LOCAL SHARED LIBRARIES : 

$(patsubst libffi, ,$(LOCAL SHARED LIBRARIES)) 


endif 
(4) 最 后 告诉 编译 系统 ，Dalvik VM 在 宿主 机 上 有 两 个 编译 结果 。 


LOCAL CFLAGS += $(host smp flag) 

LOCAL MODULE TAGS :- optional 

LOCAL MODULE :- libdvm 

include $(BUILD HOST SHARED LIBRARY) 

4 Copy the dalvik shell script to the host's bin directory 

include $(CLEAR VARS) 

LOCAL IS HOST MODULE :- true 

LOCAL MODULE TAGS :- optional 

LOCAL MODULE CLASS :- EXECUTABLES 

LOCAL MODULE :- dalvik 

include $(BUILD SYSTEM)/base rules.mk 
$(LOCAL BUILT MODULE): $(LOCAL PATH)/dalvik | $(ACP) 

Gecho "Copy: $(PRIVATE MODULE) ($@)" 

$ (copy-file-to-new-target) 

$(hide) chmod 755 $6 


它们 分 别 是 Dalvik VM 共享 库 libdvm.so 和 可 执行 文件 dalvikvm， 在 编译 后 的 目录 里 可 以 
找到 这 两 个 文件 : 

LU out/host/xxx/libs/libdvm.so. 

口 out/host/xxx/bin/dalvikvm. 

前 面 我 们 看 到 ，Dalvik VM 在 目标 机 上 编译 的 结果 可 能 有 好 几 个 ， 最 终 的 共享 库 libdvm.so， 
以 及 几 个 开发 使 用 的 共享 库 libsdvm_xx.so。 编译 这 些 目标 是 我 们 需要 首先 清理 当前 的 编译 环境 ， 
以 排除 编译 前 一 个 目标 多 带 来 的 副作用 。 这 个 工作 单独 放 到 编译 脚本 ReconfigureDvm.mk， 以 减 
少 重复 。ReconfigureDvm.mk 内 容 如 下 。 


include $(CLEAR VARS) 


# Variables used in the included Dvm.mk. 
dvm os := $(TARGET OS) 

dvm arch :- $(TARGET ARCH) 

dvm arch variant := $ (TARGET ARCH VARIANT) 


# for now, disable x86-atom variant 
ifeq ($(dvm arch variant),x86-atom) 
dvm arch variant :- x86 

endif 


include $(LOCAL PATH) /Dvm.mk 
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LOCAL SHARED LIBRARIES += liblog libcutils libnativehelper libz libdl 
LOCAL STATIC LIBRARIES «- libdex 


LOCAL C INCLUDES += external/stlport/stlport bionic/ bionic/libstdc++/include 
LOCAL SHARED LIBRARIES += libstlport 


# Don't install on any build by default 
LOCAL MODULE TAGS :- optional 


上 述 代码 的 功能 是 清除 本 地 变量 ， 设 置 dvm 变量 ， 引 入 dvm 需要 的 库 。 最 后 设置 


LOCAL MODULE TAGS W optional 来 告诉 编译 系统 除非 显 式 指明 (include dalvik/vm/ 
android.mk)， 否 则 不 会 编译 dvm。 


4.4.3 dvm.mk 文 件 


Q^ 


最 后 一 个 文件 dvm.mk， 功 能 是 设置 了 宿主 机 和 目标 机 都 需要 的 定义 。 
(1) 首先 是 设置 编译 器 选项 。 


# 

# Compiler defines. 

# 

LOCAL_CFLAGS += -fstrict-aliasing -Wstrict-aliasing=2 -fno-align-jumps 
LOCAL_CFLAGS += -Wall -Wextra -Wno-unused-parameter 

LOCAL CFLAGS += -DARCH_VARIANT=\"$ (dvm_arch_variant) \" 


(2) 接着 判断 编译 时 有 没有 指定 DEBUG_DALVIK_VM. 


# 
# Optional features. These may impact the size or performance of the VM. 
# 


# Make a debugging version when building the simulator (if not told 
# otherwise) and when explicitly asked. 
dvm_make_debug vm := false 
ifneq ($(strip $(DEBUG DALVIK VM)),) 
dvm make debug vm :- $(DEBUG DALVIK VM) 
endif 


如 果 指 定 了 该 选项 ， 则 打开 额外 的 编译 选项 ， 和 否则 什么 都 不 多 做 。 


ifeq ($(dvm make debug vm),true) 
# 
# "Debug" profile: 
$4 - debugger enabled 
# - profiling enabled 
4 - tracked-reference verification enabled 
# - allocation limits enabled 
34 - GDB helpers enabled 
# - LOGV 
# - assert() 
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# 

LOCAL CFLAGS += -DWITH INSTR CHECKS 

LOCAL CFLAGS += -DWITH EXTRA OBJECT VALIDATION 

LOCAL CFLAGS += -DWITH TRACKREF CHECKS 

LOCAL CFLAGS += -DWITH EXTRA GC CHECKS-1 

#LOCAL CFLAGS += -DCHECK MUTEX 

LOCAL CFLAGS «- -DDVM SHOW EXCEPTION-3 

# add some extra stuff to make it easier to examine with GDB 

LOCAL CFLAGS «- -DEASY GDB 

# overall config may be for a "release" build, so reconfigure these 

LOCAL CFLAGS «- -UNDEBUG -DDEBUG-1 -DLOG NDEBUG-1 -DWITH DALVIK ASSERT 
else # !dvm make debug vm 

# 

# "Performance" profile: 

# - all development features disabled 

# - compiler optimizations enabled (redundant for "release" builds 

4 - (debugging and profiling still enabled 

# 

#LOCAL_CFLAGS += -DNDEBUG -DLOG NDEBUG-1 

# "-O2" is redundant for device (release) but useful for sim (debug 

#LOCAL_CFLAGS += -02 -Winline 

#LOCAL_CFLAGS += -DWITH EXTRA OBJECT VALIDATION 

LOCAL CFLAGS «- -DDVM SHOW EXCEPTION-1 

# if you want to try with assertions on the device, add: 

#LOCAL_CFLAGS += -UNDEBUG -DDEBUG-1 -DLOG NDEBUG-1 -DWITH DALVIK ASSERT 
endif # !dvm make debug vm 


Q) 紧 接着 是 该 文件 的 大 头 ， 引 入 编译 源 文 件 。 其 中 包括 所 有 平台 都 会 使 用 到 的 源 文件 ， 
例如 AllocTracker.cpp 等 。 为 了 支持 HT 特有 的 文件 ， 例 如 compiler/Compiler.cpp 等 ， 我 们 需要 
特别 关注 下 面 的 代码 : 


ifeq ($(WITH COPYING GC),true) 
LOCAL CFLAGS += -DWITH COPYING GC 
LOCAL SRC FILES += V 
alloc/Copying.cpp.arm 
else 
LOCAL SRC FILES += V 
alloc/HeapSource.cpp V 
alloc/MarkSweep.cpp.arm 
endif 


这 是 在 指定 垃圾 收集 器 的 类 型 。 当 在 编译 选项 中 指定 WITH COPYING GC 后 就 使 用 复制 
垃圾 收集 器 ， 和 否则 就 是 用 “标记 -清除 垃圾 收集 器 ”。 由 此 可 见 ， 至 此 编译 脚本 的 解析 全 部 完成 。 
DVM 源 代码 结构 简单 ， 其 编译 脚本 的 过 程 也 很 清晰 。 


4.5 Android 4.0.1 源码 下 载 、 模 拟 器 编译 和 运行 


在 本 书 成 稿 时 ，Android 4.0.1 是 最 新 的 版 本 ， 在 接 下 来 的 内 容 中 ， 将 详细 讲解 下 载 
Android 4.0.1 源码 ， 以 及 编译 、 运 行 Android 4.0.1 模拟 器 的 基本 知识 。 


«Q 
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(1) Android ICS FAX, 
在 网 址 http://source.android.com/source/downloading.html 上 有 最 新 的 ICS 源 代码 的 同步 地 


址 。 如 果 环 境 已 经 设置 好 了 的 话 ， 同 步 最 新 的 代码 会 非常 简单 。 


$ mkdir WORKING DIRECTORY 

$ cd WORKING DIRECTORY 

$ repo init -u https://android.googlesource.com/platform/manifest -b android-4.0.1 r1 
$repo sync 


(2) Android ICS 模拟 器 的 编译 
编译 Android 4.0.1 模拟 器 的 方法 和 编译 以 前 版 本 的 方法 一 样 。 


. build/envsetup.sh 
lunch sdk-eng 
make 


编译 完成 后 ， 会 发 现在 工作 目录 ($TOP) 里 增加 了 一 个 log 文件 v8.log。 
(3) 启动 Android ICS 模拟 器 


$cd out/host/linux-x86/sdk/android-sdk eng.xxx linux-x86/tools 
$./android list targets 
Available Android targets: 
id: 1 or "android-14" 

Name: Android 4.0 

Type: Platform 

API level: 14 

Revision: 2 

Skins: QVGA, WSVGA, HVGA, WVGA854, WXGA720, WQVGA432, WVGA800 (default), WQVGA400, 
WXGA800 

ABIs : armeabi-v7a 


$./android create avd -t 1 -n ics 

Auto-selecting single ABI armeabi-v7a 

Android 4.0 is a basic Android platform. 

Do you wish to create a custom hardware profile [no] 

Created AVD 'ics' based on Android 4.0, ARM (armeabi-v7a) processor, 
with the following hardware config: 

hw.lcd.density-240 

vm.heapSize-24 

hw.ramSize-512 


$./emulator -avd ics 


此 时 emulator 就 成 功 启动 了 ， 如 图 4-2 所 示 。 
图 4-2 所 示 的 效果 比较 怪 ， 这 是 因为 没有 完成 初始 化 的 原因 ， 关 掉 后 然后 


生 新 启动 ， 此 时 


就 会 正常 显示 了 ， 如 图 4-3 所 示 。 


Q^ 


图 4-2 emulator 的 效果 
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第 5 章 Dalvik 虚拟 机 的 运作 流程 


经 过 上 一 章 的 学 习 , 已 经 了 解 了 编译 和 调试 Dalvik 虚拟 机 的 基本 知识 。 在 接 下 来 的 内 容 中 ， 
将 继续 讲解 Dalvik 的 核心 内 容 。 在 本 章 将 简要 讲解 Dalvik 虚拟 机 的 运作 流程 ， 为 读者 步 入 本 书 
后 面 知识 的 学 习 打 下 基础 。 


5.1 Dalvik 虚拟 机 相关 的 可 执行 程序 


在 Android 源码 中 ， 大 家 会 发 现 好 几 处 和 Dalvik 这 个 概念 相关 的 可 执行 程序 ， 正 确 区 分 这 
些 可 执行 程序 将 有 助 于 理解 Framework 内 部 结构 。 这 些 可 执行 程序 的 名 称 和 源码 路 径 如 表 5-1 
所 示 。 


表 5-1 和 虚拟 机 相关 的 源码 


在 接 下 来 的 内 容 中 ， 将 分 别 介绍 这 些 可 执行 程序 的 作用 。 
5.1.1 dalvikvm 


当 Java 程序 运行 时 ， 都 是 由 一 个 虚拟 机 来 解释 Java 
CPU Hinr RER 对 Java 


第 5 章 Dalvik 虚拟 机 的 运作 流程 


(1) 首先 新 建 一 个 名 为 Foojava 的 文件 ， 其 代码 如 下 。 


class Foo { 
public static void main(String[] args) { 
System.out.println("Hello dalvik"); 


} 
} 


(2) 然后 编译 文件 Foojava FÆR Jar 文件 ， 代 码 如 下 。 


$ javac Foo.java 
$ PATH-/Users/keyd/android/out/host/darwin-x86/bin:$PATH 
$ dx --dex --output-foo.jar Foo.class 
dx 工具 的 作用 是 将 .class 转换 为 .dex 文件 ， 因 为 Dalvik 虚拟 机 所 执行 的 程序 不 是 标准 的 Jar. 
文件 ， 而 是 将 Jar 文件 经 过 特别 的 转换 以 提高 执行 效率 ， 而 转换 后 的 文件 就 是 dex 文件 。dx 工 
具 是 Android 源码 的 一 部 分 ， 其 路 径 是 在 out 目录 下 ， 因 此 在 执行 dx 之 前 ， 需 要 添加 该 路 径 。 
当 执 行 dx 时 ， 参 数 “--output” 用 于 指定 Jar 文件 的 输出 路 径 ， 该 Jar 文件 内 部 包含 已 经 不 
是 纯粹 的 .class 文件 ， 而 是 dex 格式 文件 ，Jar 仅仅 是 zip 包 。 
当 生成 了 该 Jar 包 后 ， 就 可 以 把 该 Jar 包 push 到 设备 中 并 执行 ， 代 码 如 下 : 
$ adb push foo.jar /data/app 


$ adb shell dalvikvm -cp /data/app/foo.jar Foo 
Hello dalvik 


通过 上 述 命令 ， 首 先 将 该 Jar 包 push 到 /data/app 目录 下 ， 因 为 该 目录 一 般 用 于 存放 应 用 程 


序 ， 接 着 使 用 adb shell 执行 dalvikvm 程序 。dalvikvm 的 执行 语法 如 下 : 
dalvikvm -cp 类 路 径 类 名 
由 此 可 以 看 到 ，dalvikvm 的 作用 就 像 在 PC 上 执行 Java 程序 一 样 。 
5.1.2 dvz 


在 Dalvik 虚拟 机 中 ，dvz 的 作用 是 从 Zygote HERE REICH — THE ERE, Br AE RE UAE — 
个 Dalvik 虚拟 机 。 该 进程 与 dalvikvm 启动 的 虚拟 机 的 区 别 在 于 该 进程 中 已 经 预 装 了 Framework 
的 大 部 分 类 和 资源 ， 下 面 以 一 个 具体 的 例子 来 看 dvz 的 使 用 方法 。 
(1) 首先 通过 Eclipse 新 建 一 个 APK 项 目 ， 包 名 称 为 com.haiii.android.helloapk， 默 认 的 
Activity 名 称 为 Welcome， 其 代码 如 下 。 
public class Welcome extends Activity { 
/** Called when the activity is first created. */ 
@Override 
public void onCreate (Bundle savedInstanceState) { 


super.onCreate (savedInstanceState) ; 
setContentView(R. layout .main) ; 


} 


public static void main(String[] args) { 
System.out.println("Hello dalvik"); 


} 
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} 

在 上 述 代 码 中 有 一 个 static main0 函 数 ， 该 函数 将 作为 类 Welcome 的 入 口 。 

Q) 然后 将 生成 的 APK 文件 push 到 /data/app 目录 下 ,然后 运行 Welcome 类 ， 其 代码 如 下 : 

# dvz -classpath /data/app/HelloApk.apk com.haiii.android.helloapk.Welcome 

Hello dalvik 

In mgmain JNI OnLoad 

使 用 dvz 的 语法 格式 如 下 。 

dvz -classpath 包 名 称 类 名 

我 们 不 能 用 在 函数 main0 内 部 构造 一 个 Welcome 对 象 的 方法 达到 运行 该 APK 的 目的 , 这 是 
因为 类 Welcome 并 不 是 该 应 用 程序 的 入 口 类 。 一 个 APK 的 入 口 类 是 ActivityThread 25, Activity 
类 仅仅 是 被 回调 的 类 ， 因 此 不 可 以 通过 Activity 类 来 启动 一 个 APK，dvz 工具 仅仅 用 于 Framework 
开发 过 程 的 调试 。 


5.1.3 app_process 


本 章 前 面 两 节 讲 解 的 dalvikvm 和 dvz 是 通用 的 两 个 工具 ， 然 而 Framework 在 启动 时 需要 加 
载 并 运行 如 下 两 个 特定 Java 25: 

D Zygotelnit.java 

DD SystemServer.java 

为 了 便于 使 用 ， 系 统 才 提 供 了 一 个 app_process 进程 ， 该 进程 会 自动 运行 这 两 个 类 ， 从 这 个 
角度 来 讲 ，app_process 的 本 质 就 是 使 用 dalvikvm 启动 ZygoteInitjava。 并 在 启动 后 加 载 Framework 
中 的 大 部 分 类 和 资源 。 

在 接 下 来 的 内 容 中 ， 将 对 比 app_process 和 dalvikvm 的 主要 执行 过 程 。 

(1) 首先 看 dalvikvm， 其 源码 在 文件 dalvik/dalvikvm/Main.c 中 ， 该 源码 中 的 关键 代码 有 
两 处 。 


* 

* 第 一 处 : 通过 如 下 代码 创建 一 个 vm HR 

*/ 

if (JUNI CreateJavaVM(&vm, &env, &initArgs) < 0) { 
fprintf(stderr, "Dalvik VM init failed (check log file)(n"); 
goto bail; 


} 


/* 
* Make sure they provided a class name. We do this after VM init 
* so that things like "-Xrunjdwp:help" have the opportunity to emit 
* a usage statement. 
*/ 
if (argIdx -- argc) { 
fprintf(stderr, "Dalvik VM requires a class name\n"); 
goto bail; 


} 
/* 
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* We want to call main() with a String array with our arguments in it. 
* Create an array and populate it. Note argv[0] is not included. 
M 
jobjectArray strArray; 
strArray = createStringArray (env, &argv[argIdx«1], argc-argIdx-1); 
if (strArray -- NULL) 
goto bail; 


/* 

* Find [class] .main(String[]) . 
oH 

jclass startClass; 

jmethodID startMeth; 

char* cp; 


/* convert "com.android.Blah" to "com/android/Blah" */ 
slashClass = strdup (argv [argIdx] ) ; 
for (cp = slashClass; *cp !- '\0'; cp++) 


if (*cp == '.') 
*cp = !/'; 
/* 第 二 处 : 创建 好 了 JavaVm 对 象 后 ， 就 可 以 使 用 该 对 象 去 加 载 指定 的 类 了 */ 
startClass = (*env)-»FindClass(env, slashClass); 


if (startClass == NULL) { 
fprintf(stderr, "Dalvik VM unable to locate class '%s'\n", slashClass); 
goto bail; 


) 


startMeth = (*env)-»GetStaticMethodID(env, startClass, 
"main", "([Ljava/lang/String;)V"); 
if (startMeth == NULL) { 
fprintf(stderr, "Dalvik VM unable to find static main(String[]) in 'ts'\n", 
slashClass) ; 
goto bail; 


} 


/* 
* Make sure the method is public. JNI doesn't prevent us from calling 
* a private method, so we have to check it explicitly. 
a 
if (!methodIsPublic(env, startClass, startMeth)) 
goto bail; 


/* 

* Invoke main(). 

oy} 

(*env)-»CallStaticVoidMethod(env, startClass, startMeth, strArray) ; 


if (!(*env) ->ExceptionCheck (env) ) 
result = 0; 
在 上 述 第 一 处 关键 代码 处 ， 该 段 代 码 通过 调用 JNI_CreateJavaVM0O， 并 同时 创建 了 JavaVm 
At RA JNIEnv 对 象 ， 这 两 个 对 象 的 定义 如 下 : 
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JNIEnvExt* pEnv = NULL; 
JavaVMExt* pVM = NULL; 
该 函数 的 参数 是 “指针 的 指针 ”类 型 ， 其 原型 如 下 : 


int reateJava! ava! p vm, nv? p env, voi vm args 
int JNI CreateJavaVM(JavaVM** p vm, JNIEnv** p 4 id* vm args) 


在 上 述 第 二 处 关键 代码 处 ， 首 先 调用 FindClass0 找 到 指定 的 class 文件 ， 然 后 调用 
GetStaticMethodID0 找 到 main0 函 数 ， 最 后 调用 CallStatieVoidMethod 执行 该 main) AŽ 

(2) 接 下 来 看 app_process 中 是 如 何 创建 虚拟 机 并 执行 指定 的 class 文件 的 。 其 源 代 码 在 文 
件 frameworks/base/cmds/app main.cpp 中 ， 该 文件 中 的 关键 代码 有 如 下 两 处 : 

口 “” 第 一 处 : 先 创建 一 个 AppRuntime 对 象 ; 

O 第 二 处 : 调用 runtime 的 start0 方 法 启动 指定 的 classo 

在 系统 中 只 有 一 处 使 用 了 app_process， 那 就 是 在 initrc 中 。 因 为 在 使 用 时 参数 包含 了 

“--Zygote” 及 “--start-system-server”， 所 以 这 里 仅 分 析 包 含 这 两 个 参数 的 情况 。start0 方 式 是 

类 AppRuntime 的 成 员 函 数 , 而 AppRuntime 是 在 该 文件 中 定义 的 一 个 应 用 类 , 其 父 类 是 AndroidRuntime, 
该 类 的 实现 在 文件 frameworkds/base/core/jni/AndroidRuntime.cpp 中 。 在 函数 start0 中 ， 首 先 调用 
startVm0 创 建 了 一 个 vm 对 象 ,然后 就 和 dalvikvm 一 样 先 找 到 Class(), 再 执行 class 中 函数 main0， 
使 用 startVm0 函 数 创 建 vm 对 象 。 

由 上 述 过 程 可 以 看 出 ，app_process 和 dalvikvm 在 本 质 上 是 相同 的 ， 唯 一 的 区 别 就 是 app. process 
可 以 指定 一 些 特别 的 参数 ， 这 些 参数 有 利于 Framework 启动 特定 的 类 ， 并 进行 一 些 特别 的 系统 
环境 参数 设置 。 


5.2 Dalvik 虚拟 机 的 初始 化 


在 Dalvik 虚拟 机 运行 伊始 ， 先 进行 的 是 初始 化 工作 ， 此 工作 的 核心 实现 文件 是 mith 和 Init.c. 
在 本 节 的 内 容 中 ， 将 详细 讲解 Dalvik 虚拟 机 的 初始 化 过 程 。 


5.2.1 开始 虚拟 机 的 准备 工作 


在 Dalvik 虚拟 机 的 初始 化 过 程 中 ， 使 用 函数 dvmStartup0 实 现 所 有 开始 虚拟 机 的 准备 工作 ， 
此 函数 的 具体 实现 代码 如 下 。 


int dvmStartup (int argc, const char* const argv[], bool ignoreUnrecognized, 
JNIEnv* pEnv) 
{ 
int ke Ces 
assert (gDvm. initializing); 
LOGV ("WM init args (%d):\n", argc); 
for (i = 0; i < argc; i++) 
LOGV(" %d: '%s'\n", i, argv[i]); 
setCommandLineDefaults(); 
/* prep properties storage */ 
if (!dvmPropertiesStartup (argc)) 
goto fail; 
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/* 
* Process the option flags (if any). 
t 
cc = dvmProcessOptions (argc, argv, ignoreUnrecognized) ; 
if (cc != 0) { 
if (cc < 0) { 
dvmFprintf (stderr, "\n"); 
dvmUsage ("dalvikvm") ; 
} 


goto fail; 


} 


5.2.2 ”初始 化 跟踪 显示 系统 


在 Dalvik 虚拟 机 的 初始 化 过 程 中 , 使 用 函数 dvmAllocTrackerStartup0 初 始 化 跟踪 显示 系统 ， 
跟踪 系统 主要 用 生成 调试 系统 的 数据 包 ， 此 函数 的 具体 实现 代码 如 下 。 
bool dvmAllocTrackerStartup (void) 


{ 
/* prep locks */ 
dvmInitMutex (&gDvm.allocTrackerLock) ; 
/* initialized when enabled by DDMS */ 
assert (gDvm.allocRecords == NULL); 
return true; 


} 
上 述 函 数 的 实现 保存 在 文件 AllocTracker.c 中 。 


5.2.3 ”初始 化 垃圾 回收 器 


在 Dalvik 虚拟 机 的 初始 化 过 程 中 ， 使 用 函数 dvmGcStartupO 初 始 化 垃圾 回收 器 ， 此 函数 的 
具体 实现 代码 如 下 。 
bool dvmGcStartup (void) 


{ 


dvmInitMutex (&gDvm.gcHeapLock) ; 
return dvmHeapStartup(); 


} 
5.2.4 ”初始 化 线程 列表 和 主线 程 环境 参数 

在 Dalvik 虚拟 机 的 初始 化 过 程 中 , 使 用 函数 dvmThreadStartup0 初 始 化 线程 列表 和 主线 程 环 
境 参 数 ， 此 函数 的 具体 实现 代码 如 下 。 


bool dvmThreadstartup (void) 


{ 


Thread* thread; 


/* allocate a TLS slot */ 
if (pthread key create(&gDvm.pthreadKeySelf, threadExitCheck) !- 0) { 
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LOGE("ERROR: pthread key create failed\n"); 
return false; 


} 


/* test our pthread lib */ 
if (pthread getspecific(gDvm.pthreadKeySelf) !- NULL) 
LOGW("WARNING: newly-created pthread TLS slot is not NULLA"); 


/* prep thread-related locks and conditions */ 
dvmInitMutex (&gDvm.threadListLock) ; 
pthread cond init(&gDvm.threadStartCond, NULL); 
/ /dvmInitMutex (&gDvm. vmExitLock) ; 
pthread cond init(&gDvm.vmExitCond, NULL); 
dvmInitMutex(&gDvm. threadSuspendLock); 
dvmInitMutex (&gDvm.threadSuspendCountLock) ; 
pthread cond init(&gDvm.threadSuspendCountCond, NULL); 
#ifdef WITH DEADLOCK PREDICTION 
dvmInitMutex (&gDvm.deadlockHistoryLock) ; 
#endif 


/* 

* Dedicated monitor for Thread.sleep(). 

* TODO: change this to an Object* so we don't have to expose this 
* call, and we interact better with JDWP monitor calls. Requires 
* deferring the object creation to much later (e.g. final "main" 
* thread prep) or until first use. 

s 

gDvm.threadSleepMon = dvmCreateMonitor (NULL); 


gDvm.threadIdMap - dvmAllocBitVector(kMaxThreadId, false); 


thread = allocThread (gDvm.stackSize); 
if (thread -- NULL) 
return false; 


/* switch mode for when we run initializers */ 
thread-»status - THREAD RUNNING; 


/* 

* We need to assign the threadId early so we can lock/notify 
* object monitors. We'll set the "threadObj" field later. 
oy 

prepareThread (thread) ; 

gDvm.threadList = thread; 


#ifdef COUNT_PRECISE_METHODS 
gDvm.preciseMethods = dvmPointerSetAlloc (200); 
#endif 


return true; 
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上 述 函数 的 实现 保存 在 文件 Thread.c 中 。 


5.25 ”分 配 内 部 操作 方法 的 表格 内 存 


在 Dalvik 虚拟 机 的 初始 化 过 程 中 , 使 用 函数 dvmlInlineNativeStartup0 分 配 内 部 操作 方法 的 表 
格 内 存 ， 此 函数 的 具体 实现 代码 如 下 。 


bool dvmInlineNativeStartup (void) 
{ 
#ifdef WITH PROFILER 
gDvm.inlinedMethods = 
(Method**) calloc(NELEM(gDvmInlineOpsTable), sizeof (Method*)); 
if (gDvm.inlinedMethods -- NULL) 
return false; 
#endif 
return true; 
} 


上 述 函 数 的 实现 保存 在 文件 InlineNative.c 中 。 


5.2.6 ”初始 化 虚拟 机 的 指令 码 相关 的 内 容 


在 Dalvik 虚拟 机 的 初始 化 过 程 中 , 使 用 函数 dvmVerificationStartup0 初 始 化 虚拟 机 的 指令 码 
相关 的 内 容 ， 以 便 检查 指令 是 否 正确 ， 此 函数 的 具体 实现 代码 如 下 。 
bool dvmVerificationStartup (void) 
{ 
gDvm.instrWidth = dexCreateInstrWidthTable|(); 
gDvm.instrFormat = dexCreateInstrFormatTable() ; 
gDvm.instrFlags - dexCreateInstrFlagsTable(); 
if (gDvm.instrWidth -- NULL || gDvm.instrFormat -- NULL || 
gDvm.instrFlags -- NULL) 
{ 


LOGE ("Unable to create instruction tables\n") ; 
return false; 


} 


return true; 


} 
上 述 函数 的 实现 保存 在 文件 analysis\DexVerify.c 中 。 


5.2.7 ”分配 指令 寄存 器 状态 的 内 存 


在 Dalvik 虚拟 机 的 初始 化 过 程 中 ， 使 用 函数 dvmRegisterMapStartup0 分 配 指 令 寄存 器 状态 
的 内 存 。 此 函数 的 具体 实现 代码 如 下 。 


bool dvmRegisterMapStartup (void) 


{ 
#ifdef REGISTER MAP STATS 
MapStats* pStats - calloc(1, sizeof (MapStats)); 
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gDvm.registerMapStats = pStats; 
#endif 
return true; 


} 
上 述 函 数 的 实现 保存 在 文件 analysis\RegisterMap.c 中 。 


528 ”分 配 指 令 寄存 器 状态 的 内 存 


在 Dalvik 虚拟 机 的 初始 化 过 程 中 , 使 用 函数 dvmInstanceofstartup0 分 配 虚拟 机 使 用 的 缓存 。 
此 函数 的 具体 实现 代码 如 下 。 


bool dvmInstanceofStartup (void) 


{ 
gDvm.instanceofCache = dvmAllocAtomicCache (INSTANCEOF CACHE SIZE); 
if (gDvm.instanceofCache -- NULL) 
return false; 
return true; 
} 


上 述 函数 的 实现 保存 在 文件 oo\TypeCheck.c 中 。 


5.2.9 初始 化 虚拟 机 最 基本 用 的 Java 库 


在 Dalvik 虚拟 机 的 初始 化 过 程 中 , 使 用 函数 dvmClassStartup0 初 始 化 虚拟 机 最 基本 用 的 Java 
库 ， 此 函数 的 具体 实现 代码 如 下 。 


bool dvmClassStartup (void) 
{ 
ClassObject* unlinkedClass; 
/* make this a requirement -- don't currently support dirs in path */ 
if (strcmp(gDvm.bootClassPathStr, ".") == 0) { 
LOGE("ERROR: must specify non-'.' bootclasspath\n") ; 
return false; 
} 
gDvm.loadedClasses = 
dvmHashTableCreate(256, (HashFreeFunc) dvmFreeClassInnards); 
gDvm.pBootLoaderAlloc - dvmLinearAllocCreate (NULL); 
if (gDvm.pBootLoaderAlloc -- NULL) 
return false; 
if (false) [ 
linearAllocTests(); 
exit(0); 
} 
/* 
* Class serial number. We start with a high value to make it distinct 
* in binary dumps (e.g. hprof). 
e 
gDvm.classSerialNumber - INITIAL CLASS SERIAL NUMBER; 
/* Set up the table we'll use for tracking initiating loaders for 
* early classes. 


eo^» 
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* If it's NULL, we just fall back to the InitiatingLoaderList in the 
* ClassObject, so it's not fatal to fail this allocation. 
xf 
gDvm.initiatingLoaderList - 
calloc(ZYGOTE CLASS CUTOFF, sizeof (InitiatingLoaderList) ) ; 
/* This placeholder class is used while a ClassObject is 
* loading/linking so those not in the know can still say 
* "obj-»clazz-»...". 
x 
unlinkedClass = &gDvm.unlinkedJavaLangClassObject; 
memset (unlinkedClass, 0, sizeof(*unlinkedClass)); 
/* Set obj-»clazz to NULL so anyone who gets too interested 
* in the fake class will crash. 
*/ 
DVM OBJECT INIT(&unlinkedClass-»obj, NULL); 
unlinkedClass-»descriptor - "!unlinkedClass"; 
dvmSetClassSerialNumber (unlinkedClass) ; 
gDvm.unlinkedJavaLangClass = unlinkedClass; 
/* 
* Process the bootstrap class path. This means opening the specified 
* DEX or Jar files and possibly running them through the optimizer. 
” 
assert (gDvm.bootClassPath == NULL); 
processClassPath(gDvm.bootClassPathStr, true); 
if (gDvm.bootClassPath -- NULL) 
return false; 
return true; 


上 述 函数 的 实现 保存 在 文件 oo\Class.c 中 。 


5.2.10 ”进一步 使 用 的 Java 类 库 线 程 类 


在 Dalvik 虚拟 机 的 初始 化 过 程 中 ， 使 用 函数 dvmThreadObjStartup0 初 始 化 虚拟 机 进一步 使 
用 Java 类 库 线 程 类 ， 此 函数 的 具体 实现 代码 如 下 。 


bool dvmThreadObjStartup (void) 


{ 


/* 
* Cache the locations of these classes. It's likely that we're the 
* first to reference them, so they're being loaded now. 
a 
gDvm.classJavaLangThread = 
dvmFindSystemClassNoInit ("Ljava/lang/Thread;") ; 
gDvm.classJavaLangVMThread = 
dvmFindSystemClassNoInit ("Ljava/lang/VMThread;") ; 
gDvm.classJavaLangThreadGroup = 
dvmFindSystemClassNoInit ("Ljava/lang/ThreadGroup;"); 
if (gDvm.classJavaLangThread -- NULL || 
gDvm.classJavaLangThreadGroup == NULL | | 
gDvm.classJavaLangThreadGroup == NULL) 
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LOGE ("Could not find one or more essential thread classes\n"); 
return false; 


} 


/* 
* Cache field offsets. This makes things a little faster, at the 
* expense of hard-coding non-public field names into the VM. 
Me 
gDvm.offJavaLangThread vmThread = 
dvmFindFieldOffset (gDvm.classJavaLangThread, 
"vmThread", "Ljava/lang/VMThread;"); 
gDvm.offJavaLangThread group - 
dvmFindFieldOffset (gDvm.classJavaLangThread, 
"group", "Ljava/lang/ThreadGroup;"); 
gDvm.offJavaLangThread daemon - 
dvmFindFieldOffset (gDvm.classJavaLangThread, "daemon", "Z"); 
gDvm.offJavaLangThread name - 
dvmFindFieldOffset (gDvm.classJavaLangThread, 
"name", "Ljava/lang/String;"); 
gDvm.offJavaLangThread priority - 
dvmFindFieldOffset (gDvm.classJavaLangThread, "priority", "I"); 


if (gDvm.offJavaLangThread vmThread < 0 || 
gDvm.offJavaLangThread group « 0 || 
gDvm.offJavaLangThread daemon < 0 || 
gDvm.offJavaLangThread name < 0 || 
gDvm.offJavaLangThread priority « 0) 


LOGE("Unable to find all fields in java.lang.Thread\n") ; 
return false; 


} 


gDvm.offJavaLangVMThread thread = 
dvmFindFieldOffset (gDvm.classJavaLangVMThread, 
"thread", "Ljava/lang/Thread;"); 
gDvm.offJavaLangVMThread vmData - 
dvmFindFieldOffset (gDvm.classJavaLangVMThread, "vmData", "I"); 
if (gDvm.offJavaLangVMThread thread < 0 || 
gDvm.offJavaLangVMThread vmData « 0) 


{ 
LOGE("Unable to find all fields in java.lang.VMThread\n") ; 
return false; 

} 

/* 


* Cache the vtable offset for "run()". 


* We don't want to keep the Method* because then we won't find see 

* methods defined in subclasses. 

n 

Method* meth; 

meth = dvmFindVirtualMethodByDescriptor (gDvm.classJavaLangThread, "run" 


*()v"); 
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if (meth -- NULL) { 
LOGE ("Unable to find run() in java.lang.Thread n"); 
return false; 


} 
gDvm.voffJavaLangThread run = meth-»methodIndex; 
/* 
* Cache vtable offsets for ThreadGroup methods. 
| 


meth = dvmFindVirtualMethodByDescriptor (gDvm.classJavaLangThreadGroup, 
"removeThread", "(Ljava/lang/Thread;)V") ; 

if (meth == NULL) { 
LOGE("Unable to find removeThread(Thread) in java.lang.ThreadGroup\n") ; 
return false; 


} 


gDvm.voffJavaLangThreadGroup removeThread = meth-»methodIndex; 


return true; 


} 
上 述 函数 的 实现 保存 在 文件 Thread.c 中 。 


5.2.11 ”初始 化 虚拟 机 使 用 的 异常 Java BE 


在 Dalvik 虚拟 机 的 初始 化 过 程 中 ， 使 用 函数 dvmExceptionStartup0 初 始 化 虚拟 机 使 用 的 异 
常 Java 类 库 ， 此 函数 的 具体 实现 代码 如 下 。 


bool dvmExceptionStartup (void) 
{ 
gDvm.classJavaLangThrowable = 
dvmFindSystemClassNoInit ("Ljava/lang/Throwable;") ; 
gDvm. classJavaLangRuntimeException = 
dvmFindSystemClassNoInit ("Ljava/lang/RuntimeException;") ; 
gDvm.classJavaLangError = 
dvmFindSystemClassNoInit ("Ljava/lang/Error;") ; 
gDvm. classJavaLangStackTraceElement = 
dvmFindSystemClassNoInit ("Ljava/lang/StackTraceElement ;") ; 
gDvm. classJavaLangStackTraceElementArray = 
dvmFindArrayClass ("[Ljava/lang/StackTraceElement;", NULL); 
if (gDvm.classJavaLangThrowable == NULL || 
gDvm.classJavaLangStackTraceElement -- NULL || 
gDvm.classJavaLangStackTraceElementArray -- NULL) 


LOGE("Could not find one or more essential exception classes\n") ; 
return false; 


Find the constructor. Note that, unlike other saved method lookups, 
we're using a Method* instead of a vtable offset. This is because 

constructors don't have vtable offsets. (Also, since we're creating 
the object in question, it's impossible for anyone to sub-class it.) 


*o* ox ox 
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Method* meth; 

meth = dvmFindDirectMethodByDescriptor (gDvm.classJavaLangStackTraceElement, 
"<init>", "(Ljava/lang/String;Ljava/lang/String;Ljava/lang/String;I)V"); 

if (meth == NULL) { 
LOGE ("Unable to find constructor for StackTraceElement\n") ; 
return false; 

} 


gDvm.methJavaLangStackTraceElement init = meth; 


/* grab an offset for the stackData field */ 
gDvm.offJavaLangThrowable stackState = 
dvmFindFieldOffset (gDvm.classJavaLangThrowable, 
"stackState", "Ljava/lang/Object;"); 
if (gDvm.offJavaLangThrowable stackState < 0) { 
LOGE("Unable to find Throwable.stackState\n") ; 
return false; 


} 


/* and one for the message field, in case we want to show it */ 
gDvm.offJavaLangThrowable message = 
dvmFindFieldOffset (gDvm.classJavaLangThrowable, 
"detailMessage", "Ljava/lang/String;"); 
if (gDvm.offJavaLangThrowable message < 0) { 
LOGE("Unable to find Throwable.detailMessage\n") ; 
return false; 


} 


/* and one for the cause field, just ‘cause */ 
gDvm.offJavaLangThrowable cause - 
dvmFindFieldOffset (gDvm.classJavaLangThrowable, 
"cause", "Ljava/lang/Throwable;"); 
if (gDvm.offJavaLangThrowable cause < 0) { 
LOGE("Unable to find Throwable.cause\n") ; 
return false; 


) 


return true; 


} 
上 述 函 数 的 实现 保存 在 文件 Exception.c 中 。 


5.2.12 ”释放 字符 串 哈 希 表 


在 Dalvik 虚拟 机 的 初始 化 过 程 中 , 使 用 函数 dvmStringIntemStartup0 初 始 化 虚拟 机 解释 器 使 
用 的 字符 串 哈 希 表 ， 此 函数 的 具体 实现 代码 如 下 。 


bool dvmStringInternStartup (void) 


{ 


gDvm.internedStrings = dvmHashTableCreate(256, NULL); 
if (gDvm.internedStrings -- NULL) 

return false; 
return true; 
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} 
上 述 函数 的 实现 保存 在 文件 mtem.c 中 。 


5.2.13 ”初始 化 本 地 方法 库 的 表 


在 Dalvik 虚拟 机 的 初始 化 过 程 中 ， 使 用 函数 dvmNativeStartup0 初 始 化 本 地 方法 库 的 表 ， 此 
函数 的 具体 实现 代码 如 下 。 


bool dvmNativeStartup (void) 
{ 
gDvm.nativeLibs = dvmHashTableCreate(4, freeSharedLibEntry) ; 
if (gDvm.nativeLibs -- NULL) 
return false; 
return true; 


} 
上 述 函数 的 实现 保存 在 文件 Native.c 中 。 


5.2.14 ”初始 化 内 部 本 地 方法 


在 Dalvik 虚拟 机 的 初始 化 过 程 中 , 使 用 函数 dvmIntemalNativeStartupO 初 始 化 内 部 本 地 方法 ， 
建立 哈 希 表 ， 方 便 快 速 查找 。 此 函数 的 具体 实现 代码 如 下 。 


bool dvmInternalNativeStartup() 


DalvikNativeClass* classPtr = gDvmNativeMethodSet ; 
while (classPtr-»classDescriptor !- NULL) [ 
classPtr-»classDescriptorHash - 
dvmComputeUtf8Hash(classPtr-»classDescriptor); 
classPtr++; 


gDvm.userDexFiles = dvmHashTableCreate(2, dvmFreeDexOrJar); 
if (gDvm.userDexFiles == NULL) 

return false; 
return true; 


} 
上 述 函数 的 实现 保存 在 文件 native/InternalNative.cpp 中 。 


5.2.15 ”初始 化 INI 调用 表 


在 Dalvik 虚拟 机 的 初始 化 过 程 中 ， 使 用 函数 dvmJniStartup0 初 始 化 INI 调用 表 ， 以 便 快速 
找到 本 地 方法 调用 的 入 口 。 此 函数 的 具体 实现 代码 如 下 。 


bool dvmJniStartup (void) 


#ifdef USE INDIRECT REF 
if (!dvmInitIndirectRefTable (&gDvm. jniGlobalRefTable, 
kGlobalRefsTableInitialSize, kGlobalRefsTableMaxSize, 
kIndirectKindGlobal)) 
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return false; 
#else 
if (!dvmInitReferenceTable(&gDvm.jniGlobalRefTable, 
kGlobalRefsTableInitialSize, kGlobalRefsTableMaxSize) ) 
return false; 
#endif 
dvmInitMutex (&gDvm.jniGlobalRefLock) ; 
gDvm.jniGlobalRefLoMark = 0; 
gDvm.jniGlobalRefHiMark = kGrefWaterInterval * 2; 
if (!dvmInitReferenceTable (&gDvm. jniPinRefTable, 
kPinTableInitialSize, kPinTableMaxSize) ) 
return false; 
dvmInitMutex (&gDvm. jniPinRefLock) ; 
/* 
* Look up and cache pointers to some direct buffer classes, fields, 
* and methods. 
*j 
Method* meth; 
ClassObject* platformAddressClass = 


dvmFindSystemClassNoInit ("Lorg/apache/harmony/luni/platform/PlatformAddress;"); 
ClassObject* platformAddressFactoryClass - 


dvmFindSystemClassNoInit ("Lorg/apache/harmony/luni/platform/PlatformAddressFactory;" 
di 
ClassObject* directBufferClass = 
dvmFindSystemClassNoInit ("Lorg/apache/harmony/nio/internal/DirectBuffer;") ; 
ClassObject* readWriteBufferClass = 
dvmFindSystemClassNoInit ("Ljava/nio/ReadWriteDirectByteBuffer;") ; 
ClassObject* bufferClass = 
dvmFindSystemClassNoInit ("Ljava/nio/Buffer;") ; 
if (platformAddressClass == NULL || platformAddressFactoryClass == NULL || 
directBufferClass == NULL || readWriteBufferClass == NULL || 
bufferClass == NULL) 


LOGE("Unable to find internal direct buffer classes\n") ; 
return false; 
} 
gDvm. classJavaNioReadWriteDirectByteBuffer = readWriteBufferClass; 
gDvm. classOrgApacheHarmonyNioInternalDirectBuffer = directBufferClass; 
/* need a global reference for extended CheckJNI tests */ 
gDvm.jclassOrgApacheHarmonyNioInternalDirectBuffer - 
addGlobalReference((Object*) directBufferClass); 
/* 
* We need a Method* here rather than a vtable offset, because 
* DirectBuffer is an interface class. 
call 
meth = dvmFindVirtualMethodByDescriptor ( 
gDvm.classOrgApacheHarmonyNioInternalDirectBuffer, 
"getEffectiveAddress", 
" () Lorg/apache/harmony/luni/platform/Plat formAddress ;") ; 
if (meth == NULL) { 
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LOGE ("Unable to find PlatformAddress.getEffectiveAddress Wn"); 
return false; 
} 
gDvm.methOrgApacheHarmonyNioInternalDirectBuffer getEffectiveAddress = meth; 
meth = dvmFindVirtualMethodByDescriptor (platformAddressClass, 
"toLong", "()J"); 
if (meth -- NULL) { 
LOGE("Unable to find PlatformAddress.toLong\n") ; 
return false; 
} 
gDvm.voffOrgApacheHarmonyLuniPlatformPlatformAddress toLong = 
meth-»methodIndex; 
meth - dvmFindDirectMethodByDescriptor (platformAddressFactoryClass, 
"on", 
" (I) Lorg/apache/harmony/1uni /platform/PlatformAddress;"); 
if (meth -- NULL) [ 
LOGE("Unable to find PlatformAddressFactory.on\n") ; 
return false; 
} 
gDvm.methOrgApacheHarmonyLuniPlatformPlatformAddress on = meth; 
meth = dvmFindDirectMethodByDescriptor (readWriteBufferClass, 
Weinits": 
"(Lorg/apache/harmony/luni/platform/PlatformAddress;II)V"); 
if (meth == NULL) ( 
LOGE("Unable to find ReadWriteDirectByteBuffer.<init>\n") ; 
return false; 
} 
gDvm.methJavaNioReadWriteDirectByteBuffer init = meth; 
gDvm.offOrgApacheHarmonyLuniPlatformPlatformAddress osaddr - 
dvmFindFieldOffset(platformAddressClass, "osaddr", "I"); 
if (gDvm.offOrgApacheHarmonyLuniPlatformPlatformAddress osaddr « 0) ( 
LOGE("Unable to find PlatformAddress.osaddr\n") ; 
return false; 
) 
gDvm.offJavaNioBuffer capacity - 
dvmFindFieldOffset(bufferClass, "capacity", "I"); 
if (gDvm.offJavaNioBuffer capacity « 0) ( 
LOGE ("Unable to find Buffer.capacity\n") ; 
return false; 
} 
gDvm.offJavaNioBuffer_effectiveDirectAddress = 
dvmFindFieldOffset (bufferClass, "effectiveDirectAddress", "I"); 
if (gDvm.offJavaNioBuffer_effectiveDirectAddress < 0) { 
LOGE("Unable to find Buffer.effectiveDirectAddress\n") ; 
return false; 


} 
return true; 
} 
上 述 函数 的 实现 保存 在 文件 Jni.c 中 。 
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5.216 缓存 Java 类 库 里 的 反射 类 
在 Dalvik 虚拟 机 的 初始 化 过 程 中 , 使 用 函数 dvmReflectStartup0) 缓 存 Java 类 库 里 的 反射 类 。 
此 函数 的 具体 实现 代码 如 下 。 


bool dvmReflectStartup (void) 


{ 


gDvm.classJavaLangReflectAccessibleObject = 
dvmFindSystemClassNoInit ("Ljava/lang/reflect/AccessibleObject;"); 
gDvm.classJavaLangReflectConstructor - 
dvmFindSystemClassNoInit ("Ljava/lang/reflect/Constructor;"); 
gDvm.classJavaLangReflectConstructorArray - 
dvmFindArrayClass ("[Ljava/lang/reflect/Constructor;", NULL); 
gDvm.classJavaLangReflectField = 
dvmFindSystemClassNoInit ("Ljava/lang/reflect/Field;") ; 
gDvm.classJavaLangReflectFieldArray = 
dvmFindArrayClass(" [Ljava/lang/reflect/Field;", NULL); 
gDvm.classJavaLangReflectMethod - 
dvmFindSystemClassNoInit ("Ljava/lang/reflect/Method;"); 
gDvm.classJavaLangReflectMethodArray - 
dvmFindArrayClass(" [Ljava/lang/reflect/Method;", NULL); 
gDvm.classJavaLangReflectProxy - 
dvmFindSystemClassNoInit ("Ljava/lang/reflect/Proxy;"); 
if (gDvm.classJavaLangReflectAccessibleObject -- NULL || 
gDvm.classJavaLangReflectConstructor -- NULL || 
gDvm.classJavaLangReflectConstructorArray -- NULL || 
gDvm.classJavaLangReflectField -- NULL || 
gDvm.classJavaLangReflectFieldArray -- NULL || 
gDvm.classJavaLangReflectMethod -- NULL || 
gDvm.classJavaLangReflectMethodArray -- NULL || 
gDvm.classJavaLangReflectProxy -- NULL) 


LOGE ("Could not find one or more reflection classes\n") ; 
return false; 


) 


gDvm.methJavaLangReflectConstructor init - 

dvmFindDirectMethodByDescriptor (gDvm.classJavaLangReflectConstructor, 

"<init>", 

" (bjava/1lang/Class; [Ljava/lang/Class; [Ljava/lang/Class;I)V"); 
gDvm.methJavaLangReflectField init - 

dvmFindDirectMethodByDescriptor (gDvm.classJavaLangReflectField, "<init>", 

" (bjava/1lang/Class;Ljava/lang/Class;Ljava/lang/String;I) V"); 
gDvm.methJavaLangReflectMethod init - 

dvmFindDirectMethodByDescriptor (gDvm.classJavaLangReflectMethod, "<init>", 


" (Ljava/lang/Class; [Ljava/lang/Class; [Ljava/lang/Class;Ljava/lang/Class;Ljava/lang/S 
tring;I)V"); 
if (gDvm.methJavaLangReflectConstructor init -- NULL || 
gDvm.methJavaLangReflectField init -- NULL || 
gDvm.methJavaLangReflectMethod init -- NULL) 
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LOGE ("Could not find reflection constructors Mn"); 
return false; 


gDvm.classJavaLangClassArray - 
dvmFindArrayClass(" [Ljava/lang/Class;", NULL); 
gDvm.classJavaLangObjectArray - 
dvmFindArrayClass(" [Ljava/lang/Object;", NULL); 


if (gDvm.classJavaLangClassArray NULL || 
gDvm.classJavaLangObjectArray NULL) 

{ 
LOGE("Could not find class-array or object-array class\n"); 
return false; 

} 


gDvm.offJavaLangReflectAccessibleObject flag = 
dvmFindFieldOffset (gDvm.classJavaLangReflectAccessibleObject, "flag", 
"Z"); 


gDvm.offJavaLangReflectConstructor slot - 
dvmFindFieldOffset (gDvm.classJavaLangReflectConstructor, "slot", "I"); 
gDvm.offJavaLangReflectConstructor declClass - 
dvmFindFieldOffset (gDvm.classJavaLangReflectConstructor, 
"declaringClass", "Ljava/lang/Class;"); 


gDvm.offJavaLangReflectField slot - 
dvmFindFieldOffset (gDvm.classJavaLangReflectField, "slot", "I"); 
gDvm.offJavaLangReflectField declClass - 
dvmFindFieldOffset (gDvm.classJavaLangReflectField, 
"declaringClass", "Ljava/lang/Class;"); 


gDvm.offJavaLangReflectMethod slot - 
dvmFindFieldOffset (gDvm.classJavaLangReflectMethod, "slot", "I"); 
gDvm.offJavaLangReflectMethod declClass - 
dvmFindFieldOffset (gDvm.classJavaLangReflectMethod, 
"declaringClass", "Ljava/lang/Class;"); 


if (gDvm.offJavaLangReflectAccessibleObject flag < 0 || 
gDvm.offJavaLangReflectConstructor slot < 0 || 
gDvm.offJavaLangReflectConstructor declClass < 0 || 
gDvm.offJavaLangReflectField slot < 0 || 
gDvm.offJavaLangReflectField declClass < 0 || 
gDvm.offJavaLangReflectMethod slot < 0 || 
gDvm.offJavaLangReflectMethod declClass « 0) 


LOGE ("Could not find reflection fields\n") ; 
return false; 


if (!dvmReflectProxyStartup()) 
return false; 

if (!dvmReflectAnnotationStartup () ) 
return false; 
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return true; 


} 
上 述 函 数 的 实现 保存 在 文件 reflect\Reflect.c 中 。 


5.2.17 最 后 的 工作 
经 过 前 面 的 初始 化 函数 处 理 后 ， 接 着 把 下 面 的 类 先进 行 初始 化 操作 。 


staticconst char*earlyClasses[] = { 
"Ljava/lang/InternalError;", 
"Ljava/lang/StackOverflowError;", 
"Ljava/lang/UnsatisfiedLinkError;", 
"Ljava/lang/NoClassDefFoundError;", 
NULL 


m 
初始 化 这 些 类 ， 就 是 调用 函数 dvmFindSystemClassNoInit 来 初始 化 。 接 着 调用 函数 
dvmValidateBoxClasses0 来 初始 化 Java 基本 类 型 库 。 


staticconstchar*classes[] = { 
"Ljava/lang/Boolean;", 
"Ljava/lang/Character;", 
"Ljava/lang/Float;", 
"Ljava/lang/Double;", 
"Ljava/lang/Byte;", 
"Ljava/lang/Short;", 
"Ljava/lang/Integer;", 
"Ljava/lang/Long;", 

NULL 


hi 
这 些 类 调用 函数 ， 不 是 使 用 系统 函数 来 初始 化 ， 而 是 调用 函数 dvmFindClassNoInit0 来 初始 
化 。 此 函数 的 实现 代码 如 下 。 


ClassObject* dvmFindClassNoInit(const char* descriptor, 
Object* loader) 
{ 


assert(descriptor != NULL); 
//assert (loader !- NULL); 


LOGVV("FindClassNoInit '$s' %p\n", descriptor, loader); 


if (*descriptor -- '[') { 
/* 
* Array class. Find in table, generate if not found. 
Ey 
return dvmFindArrayClass (descriptor, loader); 
) eise ( 
/* 
* Regular class. Find in table, load if not found. 
jS 
if (loader !- NULL) { 
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return findClassFromLoaderNoInit (descriptor, loader); 
) eise ( 
return dvmFindSystemClassNoInit (descriptor); 


} 


调 


函数 dvmPrepMainForJni0 准 备 主线 程 里 的 解释 栈 可 以 调用 JNI 的 方法 ， 此 函数 的 实现 


代码 如 1 
boo: 


{ 


} 


1 dvmPrepMainForJni (JNIEnv* pEnv) 
Thread* self; 


/* main thread is always first in list at this point */ 
self = gDvm.threadList; 
assert (self->threadId == kMainThreadId) ; 


/* create a "fake" JNI frame at the top of the main thread interp stack */ 
if (!createFakeEntryFrame (self) ) 
return false; 


/* fill these in, since they weren't ready at dvmCreateJNIEnv time */ 
dvmSetJniEnvThreadId(pEnv, self); 
dvmSetThreadJNIEnv(self, (JNIEnv*) pEnv); 


return true; 


调用 函数 registerSystemNatives(0) 来 注册 Java 库 里 的 JNI 方法 ， 此 函数 的 实现 代码 如 下 。 


static bool registerSystemNatives (UNIEnvx pEnv) 


{ 


Thread* self; 


/* main thread is always first in list */ 
self - gDvm.threadList; 


/* must set this before allowing JNI-based method registration */ 
self-»status - THREAD NATIVE; 


if (jniRegisterSystemMethods (pEnv) < 0) { 
LOGE("jniRegisterSystemMethods failed"); 
return false; 


} 


/* back to run mode */ 
self->status = THREAD RUNNING; 


return true; 


函数 dvmCreateStockExceptions0) 分 配 异 常 出 错 的 内 存 ， 此 函数 的 实现 代码 如 下 。 
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bool dvmCreateStockExceptions (void) 


{ 


} 


/* 
* Pre-allocate some throwables. These need to be explicitly added 
* to the GC's root set (see dvmHeapMarkRootSet ()) . 
e 
gDvm.outOfMemoryObj = createStockException ("Ljava/lang/OutOfMemoryError;", 
"[memory exhausted]"); 
dvmReleaseTrackedAlloc (gDvm.outOfMemoryObj, NULL); 
gDvm.internalErrorObj - createStockException("Ljava/lang/InternalError;", 
" [pre-allocated]"); 
dvmReleaseTrackedAlloc (gDvm.internalErrorObj, NULL); 
gDvm.noClassDefFoundErrorObj - 
createStockException("Ljava/lang/NoClassDefFoundError;", NULL); 
dvmReleaseTrackedAlloc (gDvm.noClassDefFoundErrorObj, NULL); 


if (gDvm.outOfMemoryObj -- NULL || gDvm.internalErrorObj -- NULL || 
gDvm.noClassDefFoundErrorObj -- NULL) 
{ 


LOGW("Unable to create stock exceptions\n") ; 
return false; 


return true; 


调用 函数 dvmPrepMainThread0 完 成 解释 器 主线 程 的 初始 化 ， 此 函数 的 实现 代码 如 下 。 
bool dvmPrepMainThread (void) 


{ 


Thread* thread; 
Object* groupObj; 
Object* threadObj; 
Object* vmThreadObj; 
StringObject* threadNameStr; 
Method* init; 
JValue unused; 
LOGV ("+++ finishing prep on main VM thread\n"); 
/* main thread is always first in list at this point */ 
thread = gDvm.threadList; 
assert (thread->threadId 
/* 
* Make sure the classes are initialized. We have to do this before 
* we create an instance of them. 
al} 
if (!dvmInitClass(gDvm.classJavaLangClass)) { 
LOGE("'Class' class failed to initialize\n") ; 
return false; 


kMainThreadId); 


} 

if (!dvmInitClass(gDvm.classJavaLangThreadGroup) || 
!dvmInitClass (gDvm.classJavaLangThread) || 
!dvmInitClass (gDvm.classJavaLangVMThread)) 
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LOGE ("thread classes failed to initialize\n") ; 
return false; 
} 
groupObj = dvmGetMainThreadGroup () ; 
if (groupObj == NULL) 
return false; 
/* 
* Allocate and construct a Thread with the internal-creation 
* constructor. 
x 
threadObj = dvmAllocObject(gDvm.classJavaLangThread, ALLOC DEFAULT); 
if (threadObj == NULL) { 
LOGE("unable to allocate main thread object\n") ; 
return false; 
} 


dvmReleaseTrackedAlloc (threadObj, NULL); 


threadNameStr - dvmCreateStringFromCstr("main", ALLOC DEFAULT); 

if (threadNameStr -- NULL) 
return false; 

dvmReleaseTrackedAlloc((Object*)threadNameStr, NULL); 

init = dvmFindDirectMethodByDescriptor (gDvm.classJavaLangThread, "<init>", 

" (bjava/1lang/ThreadGroup;Ljava/lang/String;I2Z)V"); 

assert(init !- NULL); 

dvmCallMethod(thread, init, threadObj, &unused, groupObj, threadNameStr, 
THREAD NORM PRIORITY, false); 

if (dvmCheckException(thread)) { 
LOGE ("exception thrown while constructing main thread object in"); 
return false; 


) 
调用 函数 dvmDebuggerStartupO 进 行 调试 器 的 初始 化 ， 此 函数 的 实现 代码 如 下 。 
bool dvmDebuggerStartup (void) 


{ 
gDvm.dbgRegistry = dvmHashTableCreate(1000, NULL); 
return (gDvm.dbgRegistry !- NULL); 
} 
调用 dvmInitZygote0 或 者 dvmInitAfterZygote0 来 初始 化 线程 的 模式 ， 此 函数 的 实现 代码 
如 下 。 


Static bool dvmInitZygote (void) 


{ 
/* zygote goes into its own process group */ 
setpgid(0,0); 
return true; 

} 

bool dvmInitAfterZygote (void) 

{ 


u8 startHeap, startQuit, startJdwp; 
u8 endHeap, endQuit, endJdwp; 
startHeap - dvmGetRelativeTimeUsec(); 
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/* 
* Post-zygote heap initialization, including starting 
* the HeapWorker thread. 
ex 
if (!dvmGcStartupAfterZygote ()) 

return false; 
endHeap = dvmGetRelativeTimeUsec(); 
startQuit = dvmGetRelativeTimeUsec(); 
/* start signal catcher thread that dumps stacks on SIGQUIT */ 
if (!gDvm.reduceSignals && !gDvm.noQuitHandler) { 

if (!dvmSignalCatcherStartup () ) 

return false; 

} 
/* start stdout/stderr copier, if requested */ 
if (gDvm.logStdio) { 

if (!dvmStdioConverterStartup () ) 

return false; 

} 
endQuit = dvmGetRelativeTimeUsec() ; 
startddwp = dvmGetRelativeTimeUsec() ; 
y * 
* Start JDWP thread. If the command-line debugger flags specified 
* "suspend-y", this will pause the VM. We probably want this to 
* come last. 
i 
if (!dvmInitJDWP()) { 

LOGD("JDWP init failed; continuing anyway\n") ; 
) 


endJdwp = dvmGetRelativeTimeUsec() ; 
LOGV("thread-start heap=%d quit=%d jdwp=%d total=%d usec\n", 
(int) (endHeap-startHeap), (int) (endQuit-startQuit), 
(int) (endJdwp-startddwp), (int) (endJdwp-startHeap) ) ; 
#ifdef WITH_JIT 
if (gDvm.executionMode == kExecutionModedit) { 
if (!dvmCompilerStartup()) 
return false; 
} 
#endif 
return true; 
} 


5.3 JAZ) zygote 


在 5.1 节 中 介绍 了 Framework 的 运行 环境 ， 以 及 Dalvik 虚拟 机 的 相关 启动 方法 ，zygote 进 
程 是 所 有 APK 应 用 进程 的 父 进程 。 在 本 节 的 内 容 中 ， 将 详细 介绍 zygote 进程 的 内 部 启动 过 程 。 
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5.3.1 在 init.rc 中 配置 zygote 启动 参数 


initre 保存 在 设备 的 根 目录 下 , 我们 可 以 使 用 adb pull /initrc ~/Desktop 命令 取出 该 文件 , X 
(EP All zygote 相关 的 配置 信息 如 下 。 
service zygote /system/bin/app process -Xzygote 
/system/bin --zygote --start-system-server 
Socket zygote stream 666 
onrestart write /sys/android power/request state wake 
onrestart write /sys/power/state on 
onrestart restart media 
onrestart restart netd 
首先 在 第 一 行 中 使 用 service 指令 告诉 操作 系统 将 zygote 程序 加 入 到 系统 服务 中 , service 的 
语法 格式 如 下 。 
service service name 可 执行 程序 的 路 径 可 执行 程序 自身 所 需 的 参数 列表 


此 处 的 服务 被 定义 为 zygote。 从 理论 上 讲 ， 该 服务 的 名 称 可 以 是 任意 的 ， 可 执行 程序 的 路 
径 是 “/systemybin/app_process”， 也 就 是 前 面 所 讲 的 app_process， 一 共 包 含 如 下 4 个 参数 。 

(1) -Xzygote: 此 参数 将 作为 虚拟 机 启动 时 所 需要 的 参数 ， 是 在 AndroidRuntime.cpp 类 的 
startVm() 函 数 中 调用 JNI_CreateJavaVMO 时 被 使 用 的 。 

(2) /system/bin: 表示 虚拟 机 程序 所 在 的 目录 ， 因 为 app_process 完全 可 以 不 和 虚拟 机 在 同 
一 个 目录 ， 而 在 app process 内 部 的 AndroidRuntime 类 内 部 需要 知道 虚拟 机 所 在 的 目录 。 

(3) --zygote: 用 于 指明 以 ZygoteInit 类 作为 虚拟 机 执行 的 入 口 ， 如 果 没 有 --zygote 参数 ， 则 
需要 明确 指定 需要 执行 的 类 名 。 

(4) --start-system-server: 仅 在 指定 参数 --zygote MAAR, 意思 是 告知 Zygotelnit 启动 完毕 
后 贱 化 出 第 一 个 进程 SystemServer。 

后 面 的 配置 命令 socket 用 于 指定 该 服务 所 使 用 到 的 socket， 后 面 的 参数 依次 是 名 称 、 类 型 、 
端口 地 址 。 

onrestart 命令 用 于 指定 该 服务 重启 的 条 件 ， 即 当 满 足 这 些 条 件 后 ，zygote 服务 就 需要 重启 ， 
这 些 条 件 一 般 是 一 些 系统 异常 条 件 。 


5.3.2 ”启动 Socket 服务 端口 


当 zygote 服务 从 app_process 启动 后 ， 会 启动 一 个 Dalvik 虚拟 机 。 因 为 虚拟 机 执行 的 第 一 
个 Java 类 是 ZygoteInitjava， 所 以 接 下 来 的 过 程 就 从 类 Zygotelnit 中 的 函数 main(0) 开 始 讲 起 。 函 
数 main0 中 做 的 第 一 个 重要 工作 就 是 启动 一 个 Socket 服务 端口 ， 该 Socket 端口 用 于 接收 启动 新 
进程 的 命令 。 

在 静态 函数 registerZygoteSocket0 中 ， 完 成 启动 Socket 服务 端口 的 功能 ， 实 现代 码 如 下 。 

private static void registerZygoteSocket() { 
if (sServerSocket -- null) { 
int fileDesc; 


try { 
String env = System.getenv(ANDROID SOCKET ENV) ; 
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try { 
sServerSocket = new LocalServerSocket ( 
createFileDescriptor (fileDesc) ) ; 


在 上 述 代码 中 ， 首 先 调用 System.getenvO 获 取 系统 为 zygote 进程 分 配 的 Socket 文件 描述 符 
号 ， 然 后 调用 createFileDescriptor0 创 建 一 个 真正 的 文件 描述 符 ， 最 后 以 该 描述 符 为 参数 ， 构 造 
了 一 个 LocalServerSocket 对 象 。 


注意 : 在 Linux 系统 中 ， 所 有 的 系统 资源 都 可 以 看 成 是 文件 ， 甚 至 包括 内 存 和 CPU， 因 此 ， 像 
标准 的 磁盘 文件 或 者 网 络 Socket 自然 也 被 认为 是 文件 ， 这 就 是 为 什么 LocalServerSocket 
构造 函数 的 参数 是 一 个 文件 描述 符 。 

在 Socket 编程 中 ， 有 如 下 两 种 触发 Socket 数据 读 操 作 的 方式 。 

(1) 使 用 listen0 监 听 某 个 端口 ， 然 后 调用 read0 去 从 这 个 端口 上 读数 据 ， 这 种 方式 被 称 为 
阻塞 式 读 操作 ， 因 为 当 端口 没有 数据 时 ，readO 函 数 将 一 直 等 待 ， 直 到 数据 准备 好 后 才 
返回 。 

(2) 使 用 selectO 函 数 将 需要 监测 的 文件 描述 符 作为 selectO 函 数 的 参数 ， 然 后 当 该 文件 描 
述 符 上 出 现 新 的 数据 后 ， 自 动 触 发 一 个 中 断 ， 然 后 在 中 断 处 理 函 数 中 再 去 读 指定 文件 描 
述 符 上 的 数据 ， 这 种 方式 被 称 为 非 阻塞 式 读 操作 。LocalServerSocket 中 使 用 的 正 是 后 者 ， 
即 非 阻 塞 读 操作 。 


当 准 备 好 LocalServerSocket 端口 后 ， 在 函数 main0 中 调用 runSelectLoopMode0 进 入 非 阻塞 
读 操 作 ， 该 函数 会 先 将 sServerSocket 加 入 到 被 监测 的 文件 描述 符 列表 中 ， 然 后 在 while(true) 循 
环 中 将 该 文件 描述 符 添加 到 select 的 列表 中 ， 并 调用 ZygoteConnection 类 的 ranOnce() 函 数 处 理 
每 一 个 Socket 接收 到 的 命令 ， 实 现代 码 如 下 。 


try { 
fdArray = fds.toArray(fdArray) ; 
index = selectReadable (fdArray) ; 
} catch (IOException ex) { 
throw new RuntimeException("Error in select()", ex); 


} 


if (index < 0) { 

throw new RuntimeException("Error in select ()"); 
} else if (index == 0) { 

ZygoteConnection newPeer = acceptCommandPeer () ; 

peers .add (newPeer) ; 

fds.add (newPeer.getFileDesciptor()); 
) eise ( 

boolean done; 

done = peers.get (index) .runOnce() ; 

if (done) { 

peers.remove (index); 
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fds .remove (index); 
} 
} 
函数 selectReadable0 有 如 下 三 种 返回 值 。 
ü -1: 代表 内 部 错误 。 
口 0: 代表 没有 可 处 理 的 连接 ,因此 会 以 Socket 服务 端口 重新 建立 一 个 ZygoteConnection 
对 象 ， 并 等 待 客户 端的 请 求 。 
口 KF 0: 代表 还 有 没有 处 理 完 的 连接 请 求 ， 因 此 需要 先 处 理 该 请 求 ， 而 暂时 不 需要 建 
立新 的 连接 等 待 。 
函数 ruanOnce0 的 核心 代码 是 基于 zygote 进程 孵化 出 的 新 应 用 进程 。 而 在 SystemServer 
进程 中 会 创建 一 个 Socket 客户 端 ， 具 体 的 实现 代码 是 在 Process.java 类 中 ， 而 调用 Process 类 是 
在 类 Ams 中 的 startProcessLocked0 函 数 中 。 而 函数 start0 内 部 又 调用 了 静态 函数 startViaZygote0， 
该 函数 的 实体 是 使 用 一 个 本 地 Socket [A] zygote 中 的 Socket 发 送 进 程 启动 命令 , 其 执行 流程 如 下 。 
将 startViaZygote0 的 函数 参数 转换 为 一 个 ArrayList<String> 列 表 。 
然后 再 构造 出 一 个 LocalSocket 本 地 Socket 接口 。 
通过 该 LocalSocket 对 象 构造 出 一 个 BufferedWriter 对 象 。 
通过 该 对 象 将 ArralyList<String> 列 表 中 的 参数 传递 给 zygote 中 的 LocalServerSocket 
对 象 。 
口 在 zygote 端 调用 Zygote.forkAndSpecialize0 函 数 旷 化 出 一 个 新 的 应 用 进程 。 


oooo 


5.3.8 加载 preload-classes 


在 类 Zygotelnit 的 函数 main0 中 ， 创 建 完 Socket MRA Hin a AA le v BN HAEA HERE, PY 
这 个 “ 卵 ” 中 还 没有 预 装 的 Framework 大 部 分 类 及 资源 。 

预 装 的 类 列表 是 在 framework.jar 中 的 一 个 文本 文件 列表 ， 名 称 为 preload-classes， 该 列表 的 
原始 定义 在 文本 文件 frameworks/base/preload-classes 中 ， 而 该 文件 又 是 通过 如 下 类 生成 的 。 


frameworks/base/tools/preload/WritePreloadedClassFile.java 
生成 preload-classes 的 方法 是 在 Android 根 目录 下 执行 如 下 命令 。 


$java -Xss512M -cp /path/to/preload.jar WritePreloadedClassFile /path/to/.compiled 
1517 classses were loaded by more than one app. 

Added 147 more to speed up applications. 

1664 total classes will be preloaded. 

Writing object model... 

Done! 


在 上 述 命令 中 ，/path/to/preload.jar 是 指 如 下 文件 。 
out/host/darwin-x86/framework/preload.jar 


上 述 .jar 文件 是 由 frameworks/base/tools/preload 子 项 目 编译 而 成 的 。 
/path/to/.compiled/ 是 指 如 下 目录 下 的 几 个 .compiled 文件 。 


frameworks/base/tools/preload 


«Q 


参数 “-Xss” 用 于 执行 该 程序 所 需要 的 Java 虚拟 机 栈 大 小 ， 此 处 为 S12MB， 默 认 的 大 小 不 
能 满足 该 程序 的 运行 ， 会 抛 出 javalang.StackOverflowError 错误 信息 。 

WritePreloadedClassFile 表示 要 执行 的 具体 类 。 

当 执 行 完 以 上 命令 后 ， 会 在 frameworks/base 目录 下 产生 preload-classes 文本 文件 。 从 该 命 
令 的 执行 情况 来 看 ， 预 装 的 Java 类 信息 包含 在 .compiled 文件 中 ， 而 这 个 文件 却 是 一 个 二 进 制 文 
件 ， 尽 管 我 们 目前 能 够 确 知 如 何 产生 preload-classes， 但 却 无 法 明确 这 个 .compiled 文件 是 如 何 产 
生 的 。 

在 Android 项 目 组 内 部 可 能 会 存在 一 个 测试 项 目 , 一 旦 运行 该 项 目 ,就 会 装载 一 些 Java 类 。 
当然 这 些 Java 类 是 测试 项 目 中 的 程序 代码 主动 装载 的 , 而 这 些 程序 代码 被 认为 是 大 多 数 Android 
程序 运行 时 都 会 执行 的 代码 。 一 旦 该 运行 环境 建立 后 ，Dalvik 虚拟 机 内 存 中 就 记录 了 所 有 被 装 
载 的 Java 类 ,然后 该 测试 项 目 会 使 用 一 个 特别 的 工具 从 虚拟 机 内 存 中 读 取 所 有 装载 过 的 类 信息 ， 
并 生成 compiled 文件 。 当 然 ， 这 只 是 一 种 假设 。 

在 编译 Android 源码 的 时 候 , 会 最 终 把 preload-classes 文件 打包 到 framework jar 中 。 这 样 有 
了 这 个 列表 后 ，ZygoteInit 中 通过 调用 preloadClasses0 完 成 装载 这 些 类 。 装 载 的 方法 很 简单 ， 就 
是 读 取 preload-classes 列表 中 的 每 一 行 ， 因 为 每 一 行 代表 了 一 个 具体 的 类 ， 然 后 调用 
Class.forName0 装 载 目标 类 。 在 装载 的 过 程 中 ， 忽 略 以 # 开 始 的 目标 类 ， 并 忽略 换行 符 及 空格 。 


5.3.4 HŽ preload-resources 


preload-resources 是 在 如 下 文件 中 被 定义 的 。 


frameworks/base/core/res/res/values/arrays.xml 


在 preload-resources 包含 了 两 类 资源 ， 一 类 是 drawable 资源 ， 另 一 类 是 color 资源 ， 下 面 是 
对 应 的 代码 。 


«array name-"preloaded drawables"» 
«item»Gdrawable/sym def app icon«/item» 


«/array» 
«array name-"preloaded color state lists" 
«item»Gcolor/hint foreground dark«/item» 


</array> 

加 载 这 些 资 源 功能 是 在 函数 preloadResources0 中 实现 的 ， 在 该 函数 中 分 别 调 用 了 如 下 连 个 
函数 来 加 载 这 两 类 资源 。 

ū preloadDrawables() 

ü preloadColorStateLists() 

具体 的 加 载 原 理 非常 简单 ， 就 是 把 这 些 资源 读 出 来 放 到 一 个 全 局 变量 中 ， 只 要 该 类 对 象 不 
被 销毁 ， 这 些 全 局 变量 就 会 一 直 保 存 。 

通过 全 局 变量 是 mResources 来 保存 Drawable 资源 ， 该 变量 的 类 型 是 Resources 类 ， 由 于 在 
该 类 内 部 会 保存 一 个 Drawable 资源 列表 ， 因 此 实际 上 是 在 Resources 内 部 缓存 这 些 Drawable 资 
源 的 。 保 存 Color 资源 的 全 局 变量 的 功能 也 是 mResources 实现 的 。 同样， 在 类 Resources 内 部 也 
有 一 个 Color 资源 列表 。 


@> 
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5.3.5 (H folk 启动 新 进程 


folk 是 Linux 系统 中 的 一 个 系统 调用 , 其 功能 是 复制 当前 进程 并 产生 一 个 新 的 进程 。 除 了 进 
程 id 不 同 ， 新 的 进程 将 拥有 和 原始 进程 完全 相同 的 进程 信息 。 进 程 信息 包括 该 进程 所 打开 的 文 
件 描述 符 列表 、 所 分 配 的 内 存 等 。 当 创建 新 进程 后 ， 两 个 进程 将 共享 已 经 分 配 的 内 存 空间 ， 直 
到 其 中 一 个 进程 需要 向 内 存 中 写 入 数据 ， 操 作 系 统 才 负责 复制 一 份 目标 地 址 空间 ， 并 将 要 写 的 
数据 写 入 到 新 地 址 中 ， 这 就 是 “copy-on-write( 仅 当 写 的 时 候 才 复制 )” 机 制 ， 这 种 机 制 可 以 最 大 
限度 地 在 多 个 进程 中 共享 物理 内 存 。 

在 所 有 的 操作 系统 中 都 存在 一 个 程序 装载 器 ， 程 序 装载 器 一 般 会 作为 操作 系统 的 一 部 分 ， 
并 由 Shell 程序 调用 。 当 内 核 启动 后 , 会 首先 启动 Shell 程序 。 常见 的 Shell 程序 包含 如 下 两 大 类 : 

口 命令 行 界面 

Q ”窗口 界面 

Windows 系统 中 的 Shell 程序 就 是 桌面 程序 , Ubuntu 系统 中 的 Shell 程序 就 是 GNOME 桌面 
程序 。 当 启动 Shell 程序 后 ， 用 户 可 以 双击 桌面 图 标 启动 指定 的 应 用 程序 ， 而 在 操作 系统 内 部 ， 
启动 新 的 进程 包含 如 下 三 个 过 程 。 

(1) 第 一 个 过 程 ， 内 核 创建 一 个 进程 数据 结构 ， 用 于 表示 将 要 启动 的 进程 。 

(2) 第 二 个 过 程 ， 内 核 调用 程序 装载 器 函数 ， 从 指定 的 程序 文件 读 取 程序 代码 ， 并 将 这 些 
程序 代码 装载 到 预先 设 定 的 内 存 地址 。 

(3) 第 三 个 过 程 ， 装 载 完毕 后 ， 内 核 将 程序 指针 指向 到 目标 程序 地 址 的 入 口 处 开始 执行 指 
定 的 进程 。 当 然 ， 实 际 的 过 程 会 考虑 更 多 的 细节 ， 不 过 大 致 思路 就 是 这 么 简单 。 

在 一 般 情 况 下 ， 没 有 必要 复制 进程 ， 而 是 按照 以 上 三 个 过 程 创建 新 进程 ， 但 当 满 足以 下 条 
件 时 ， 则 由 于 函数 folk0 是 Linux 的 系统 调用 ，Android 中 的 Java 层 仅仅 是 对 该 调用 进行 了 INI 
封装 而 已 ， 因 此 ， 接 下 来 以 一 段 C 代码 来 介绍 使 用 函数 folk0 的 过 程 ， 以 便 大 家 对 该 函数 有 更 具 
体 的 认识 。 

/** 
*FileName: abc.c 
wf 
#include <sys/types.h> 
#include <unistd.h> 
int main(){ 
pid t pid; 
printf ("pid = %d, Take camera, by subway, take air! \n", getpid()); 
pid = folk(); 
if(pid > 0){ 
printf ("pid=sd, RMR! Wn", getpid()); 
pid = folk(); 
if(!pid) printf ("pid=%d， 去 看 考 拉 ! \n", getpid()); 


else if (!pid) printf ("pid=%d， 去 看 袋鼠 ! Wn", getpid()); 
else if (pid == -1) perror("folk"); 
getchar(); 


} 
执行 上 述 代码 后 会 输出 如 下 信息 。 


< 
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$ ./abc.bin 
pid - 3927, Take camera, by subway, take air! 
pid=3927， 我 是 精灵 ! 
pid=3929， 去 看 袋鼠 ! 
pid=3930， 去 看 考 拉 ! 
函数 folkO 的 返回 值 与 普通 函数 调用 完全 不 同 ， 具 体 说 明 如 下 。 
口 “ 当 返回 值 大 于 0 时 ， 代 表 的 是 父 进程 ; 
口 “ 当 等 于 0 时 ， 代 表 的 是 被 复制 的 进程 。 
也 就 是 说 ， 父 进程 和 子 进程 的 代码 都 在 该 C 文件 中 ， 只 是 不 同 的 进程 执行 不 同 的 代码 ， 而 
进程 是 靠 folkO 的 返回 值 进行 区 分 的 。 
由 以 上 执行 结果 可 以 看 出 ， 第 一 次 调用 folk0 时 复制 了 一 个 “看 袋鼠 ”进程 ， 然 后 在 父 进程 
中 再 次 调用 folk0 复 制 了 “看 考 拉 ”的 进程 ， 三 者 都 有 各 自 不 同 的 进程 id。 
zygote 进程 就 是 上 述 演示 代码 中 的 “精灵 进程 ”。 在 文件 Zygotelnitjava 中 复制 新 进程 是 通 
过 在 函数 runSelectLoopMode0 中 调用 类 ZygoteConnection 的 函数 runOnce0 完 成 的 ， 在 该 函数 中 
通过 调用 forkAndSpecialize0 函 数 来 复制 一 个 新 的 进程 。 
函数 forkAndSpecialize0 是 一 个 native( 本 地 ) 函 数 ， 其 内 部 的 执行 原理 和 上 面 的 C 代码 类 似 。 
当 新 进程 被 创建 好 后 ， 还 需要 做 一 些 “完善” 工作 。 因 为 当 zygote 复制 新 进程 时 ， 已 经 创建 了 
一 个 Socket 服务 端 ， 而 这 个 服务 端 是 不 应 该 被 新 进程 使 用 的 ， 否 则 系统 中 会 有 多 个 进程 接收 
Socket 客户 端的 命令 。 因 此 ， 新 进程 被 创建 好 后 ， 首 先 需要 在 新 进程 中 关闭 该 Socket 服务 端 ， 
并 调用 新 进程 中 指定 的 Class 文件 的 main0 函 数 作为 新 进程 的 入 口 点 。 而 这 些 正 是 在 调用 函数 
forkAndSpecialize0 后 根据 返回 值 pid 完成 的 。 当 pid 等 于 0 时 ， 代 表 的 是 子 进 程 ， 函 数 
handleChildProcO 会 从 指定 Class 文件 的 main0 函 数 处 开始 执行 。 新 的 进程 会 完全 脱离 了 zygote 
进程 的 能 化 过 程 ， 成 为 一 个 真正 的 应 用 进程 。 


5.4 启动 SystemServer 进程 


SystemServer 进程 是 zygote 孵化 出 的 第 一 个 进程 , 该 进程 是 从 Zygotelnit java 的 maino% 
中 调用 startSystemServerO 开 始 的 。 与 启动 普通 进程 的 差别 在 于 ， 类 zygote 为 启动 SystemServer 
提供 了 专门 的 函数 startSystemServer(), ， 而 不 是 使 用 标准 的 forAndSpecilize0 函 数 。 同 时 ， 
SystemServer 进程 启动 后 首先 要 做 的 事情 和 普通 进程 也 有 所 差别 。 

函数 startSystemServer() 的 关键 功能 如 下 。 

(1) 定义 了 一 个 String[] 数 组 ， 数 组 中 包含 了 要 启动 的 进程 的 相关 信息 ， 其 中 最 后 一 项 指定 
新 进程 启动 后 装载 的 第 一 个 Java 类 ， 此 处 即 为 类 com.android.server.SystemServer。 

(2) 调用 forkSystemServer0 从 当前 的 zygote 进程 星 化 出 新 的 进程 。 该 函数 是 一 个 native ER 
数 ， 其 作用 与 folkAndSspecilize0 相 似 。 

(3) 启动 新 进程 后 ， 在 函数 handleSystemServerProcess0 中 主要 完成 如 下 两 件 事情 。 

O 关闭 Socket 服务 端 。 

口 执行 com.android.server.SystemServer 类 中 的 函数 main0 。 

除了 这 两 个 主要 事情 外 ， 还 做 了 一 些 额外 的 运行 环境 配置 ， 这 些 配置 主要 在 函数 
commonInit0 和 函数 zygoteInitNative0 中 完成 。 一 旦 配置 好 SystemServer 的 进程 环境 后 ， 就 从 类 
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SystemServer 中 的 main0 函 数 开始 运行 。 


5.4.1 启动 各 种 系统 服务 线程 


SystemServer 进程 在 Android 的 运行 环境 中 扮演 了 “中 枢 ” 的 作用 ， 在 APK 应 用 中 能 够 直 
接 交 互 的 大 部 分 系统 服务 都 在 这 个 进程 中 运行 ， 例 如 WindowManagerServer(Wms) 、 
ActivityManagerSystemService(AmS)、PackageManagerServer(PmS) 等 常见 的 应 用 ， 这 些 系统 服务 
都 是 以 一 个 线程 的 方式 存在 于 SystemServer 进程 中 。 下 面 就 来 介绍 到 底 都 有 哪些 服务 线程 ， 及 
其 启动 的 顺序 。 

SystemServer 中 的 main0 函 数 首先 调用 的 是 函数 init10， 这 是 一 个 native 函数 ， 内 部 会 进行 
一 些 与 Dalvik 虚拟 机 相关 的 初始 化 工作 。 该 函数 执行 完毕 后 ， 其 内 部 会 调用 Java 端的 init20 函 
数 ， 这 就 是 为 什么 Java 源码 中 没有 引用 init20 的 地 方 ， 主 要 的 系统 服务 都 是 在 init20 函 数 中 完 
成 的 。 

该 函数 首先 创建 了 一 个 ServerThread 对 象 ， 该 对 象 是 一 个 线程 ， 然 后 直接 运行 该 线程 ， 从 
ServerThread 的 run() 方 法 内 部 开始 真正 启动 各 种 服务 线程 .基本 上 每 个 服务 都 有 对 应 的 Java 35, 
从 编码 规范 的 角度 来 看 ， 启 动 这 些 服务 的 模式 可 归 类 为 如 下 三 种 。 

O 模式 一 : 是 指 直接 使 用 构造 函数 构造 一 个 服务 ， 由 于 大 多 数 服务 都 对 应 一 个 线程 ， 因 

此 ， 在 构造 函数 内 部 就 会 创建 一 个 线程 并 自动 运行 。 
O 模式 二 : 是 指 服 务 类 会 提供 一 个 getInstance0 方 法 ， 通 过 该 方法 获取 该 服务 对 象 ， 这 样 
的 好 处 是 保证 系统 中 仅 包 含 一 个 该 服务 对 象 。 

O 模式 三 ， 是 指 从 服务 类 的 main0 函 数 中 开始 执行 。 

无 论 以 上 何 种 模式 ， 当 创建 了 服务 对 象 后 ， 有 时 可 能 还 需要 调用 该 服务 类 的 init0 函 数 或 者 
systemReady() 函 数 来 完成 该 对 象 的 启动 ， 当 然 这 些 都 是 服务 类 内 部 自 定义 的 。 为 了 区 分 以 上 启 
动 的 不 同 ， 以 下 采用 一 种 新 的 方式 描述 该 启动 过 程 。 

在 下 面 的 表 5-2 中 列 出 了 SystemServer 中 所 启动 的 所 有 服务 ， 以 及 这 些 服 务 的 启动 模式 。 


表 5-2 SystemServer 中 启动 服务 列表 


服务 类 名 称 作用 描述 启动 模式 

EntropyService 提供 伪 随 机 数 10 

PowerManagerService 电源 管理 服务 1.2/3 

ActivityManagerService 最 核心 的 服务 之 一 ， 管 理 Activi 自 定义 

eli saan E bala 比如 重启 、 关 T 
闭 、 启 动 等 

PackageManagerService 程序 包 管理 服务 3.3 

ee 账户 管理 服务 , 是 指 联系 人 账户 , 而 不 是 Linux 系统 的 T 
账户 

ContentService ContentProvider 服务 ， 提 供 跨 进程 数据 交换 3.0 

BatteryService 电池 管理 服务 1.0 

LightsService 自然 光 强度 感应 传感器 服务 1.0 
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Er 
服务 类 名 称 作用 描述 启动 模式 

VibratorService 震动 器 服务 1.0 
AlarmManagerService 定时 器 管理 服务 ， 提 供 定时 提醒 服务 1.0 
WindowManagerService Framework 最 核心 的 服务 之 一 ， 负 责 窗口 管理 3.3 
BluetoothService 蓝牙 服务 1.0+ 
DevicePolicyManagerService | 提供 一 些 系统 级 别 的 设置 及 属性 1.3 
StatusBarManagerService 状态 栏 管理 服务 13 
ClipboardService 系统 剪 切 板 服务 1.0 
InputMethodManagerService | 输入 法 管理 服务 1.0 
NetStatService 网 络 状 态 服务 1.0 
NetworkManagementService | 网 络 管理 服务 NMS.create() 
ConnectivityService 网 络 连 接管 理 服务 23 
ThrottleService 暂 不 清楚 其 作用 13 
AccessibilityManagerService eee ONE ORDRE 1.0 

些 输入 给 用 户 一 些 额外 的 反馈 ， 起 到 辅助 的 效果 
MountService 挂 载 服务 , 可 通过 该 服务 调用 Linux 层面 的 mount 程序 | 1.0 
NotificationManagerService TRIN MESTRE MAE 13 

态 栏 在 一 起 ， 只 是 界面 上 前 者 在 左边 ， 后 者 在 右边 
DeviceStorageMonitorService | 磁盘 空间 状态 检测 服务 1.0 
LocationManagerService 地 理 位 置 服 务 13 
SearchManagerService 搜索 管理 服务 1.0 
DropBoxManagerService 通过 该 服务 访问 Linux 层面 的 Dropbox 程序 1.0 
WallpaperManagerService elton he 1.3 

在 View 系统 内 部 ， 墙 纸 可 以 作为 任何 窗口 的 背景 
AudioService 音频 管理 服务 1.0 
BackupManagerService 系统 备份 服务 1.0 
AppWidgetService Widget 服务 13 
RecognitionManagerService 身份 识别 服务 13 
DiskStatsService 磁盘 统计 服务 1.0 
Ams 的 启动 模式 如 下 。 

调用 函数 main0 返 回 一 个 Context 对 象 ， 而 不 是 AmS 服务 本 身 。 


调用 AmS.setSystemProcess(). 

调用 AmS.installProviders() 

调用 systemReady0， 当 AmS 执行 完 systemReadyO 后 ， 会 相继 启动 相关 联 服务 的 
systemReady() 函 数 ， 完 成 整体 初始 化 。 
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5.4.2 ”启动 第 一 个 Activity 


当 启 动 以 上 服务 线程 后 , ActivityManagerService(AmS) 服 务 是 以 systemReady() 调 用 完成 最 后 
启动 的 ,而 在 AmS 的 函数 systemReady0 内 部 的 最 后 一 段 代码 则 发 出 了 启动 任务 队列 中 最 上 面 一 
个 Activity 的 消息 。 因 为 在 系统 刚 启动 时 ，mMainStack 队列 中 并 没有 任何 Activity 对 象 ， 所 以 
在 类 ActivityStack 中 将 调用 函数 startHomeActivityLocked(). 

开机 后 ， 系 统 从 哪个 Activity 开始 执行 这 一 动作 ， 完 全 取决 于 mMainStack 队列 中 的 第 一 个 
Activity 对 象 。 如 果 在 ActivityManagerService 启动 时 能 够 构造 一 个 Activity 对 象 (并 不 是 说 构造 
出 一 个 Activity 类 的 对 象 )， 并 将 其 放 到 mMainStack 队列 中 ， 那 么 第 一 个 运行 的 Activity 对 象 就 
是 这 个 Activity， 这 一 点 不 像 其 他 操作 系统 中 通过 设置 一 个 固定 程序 作为 第 一 个 启动 程序 。 

1E Ans 的 startHomeActivityLocked0 中 , 系统 发 出 了 一 个 catagory 字段 包含 CATEGORY_HOME 
的 intent。 

无 论 是 哪个 应 用 程序 ， 只 要 声明 自己 能 够 响应 该 ntent， 那 么 就 可 以 被 认为 是 Home 程序 ， 
这 就 是 为 什么 在 Android 领域 会 存在 各 种 “Home 程序 ”的 原因 。 系 统 并 没有 给 任何 程序 赋予 

“Home” 特 权 ， 而 只 是 把 这 个 权利 交 给 了 用 户 。 当 在 系统 中 有 多 个 程序 能 够 响应 该 ntent 时 ， 
系统 会 弹出 一 个 对 话 框 ， 请 求 用 户 选 择 启动 哪个 程序 ， 并 允许 用 户 记 住 该 选择 ， 从 而 使 得 以 后 
每 次 按 Home 键 后 都 启动 相同 的 Activity。 这 就 是 第 一 个 Activity 的 启动 过 程 。 


5.5 class 类 文件 的 加 载 


Java 的 源 代码 经 过 编译 后 会 生成 “.class” 格 式 的 文件 ， 即 字 节 码 文件 。 然 后 在 Android 中 
使 用 dx 工具 将 其 转换 为 后 缀 为 “jar” 格 式 的 dex 文件 。Dalvik 虚拟 机 负责 解释 并 执行 编译 后 
的 字 节 码 。 在 解释 执行 字 节 码 之 前 ， 当 然 要 读 取 、 分 析 文 件 的 内 容 ， 得 到 字 节 码 ， 然 后 才能 解 
释 执行 。 在 整个 的 加 载 过 程 中 ， 最 为 重要 的 就 是 对 Class 的 加 载 ，Class 包含 Method, Method 又 
包含 code。 通 过 对 Class 的 加 载 ， 我 们 即 可 获得 所 需 执行 的 字 节 码 。 本 节 将 从 dexfile 文件 分 析 
及 Class 加 载 中 的 数据 结构 入 手 ， 结 合 主要 流程 ， 对 整个 加 载 过 程 进行 分 析 。 


5.5.1 DexFile 在 内 存 中 的 映射 


在 Android 系统 中 , java 源 文件 会 被 编译 为 “jar” 格 式 的 dex 类 型 文件 , 在 代码 中 称 为 dexfile。 
在 加 载 Class 之 前 ， 必 先 读 取 相 应 的 jar 文件 。 通 常 我 们 使 用 read0 函 数 来 读 取 文件 中 的 内 容 。 
但 在 Dalvik 中 使 用 mmap0 函 数 。 和 read0O 不 同 ，mmap0 函 数 会 将 dex 文件 映射 到 内 存 中 ， 这 样 
通过 普通 的 内 存 读 取 操 作 即 可 访问 dex file 中 的 内 容 。 

Dexfile 的 文件 格式 如 图 5-1 所 示 ， 主 要 有 三 部 分 组 成 : 头 部 ， 索 引 ， 数 据 。 通 过 头 部 可 知 
索引 的 位 置 和 数目 ， 可 知 数据 区 的 起 始 位 置 。 其 中 classDefsOff 指定 了 ClassDef 在 文件 的 起 始 
位 置 ，dataOff 指定 了 数据 在 文件 的 起 始 位 置 ，ClassDef 即 可 理解 为 Class 的 索引 。 通 过 读 取 
ClassDef 可 获知 Class 的 基本 信息 ， 其 中 classDataOff 指定 了 Class 数据 在 数据 区 的 位 置 。 
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射 (调用 Mmap 函 数 ) 


DexOptHeader 


DexHeader 其 他 项 


dexFileParseO) 函 数 分 析 dex 


file, 并 构建 DexFile 数 据 结构 DexHeader 


classDefsOff 


DexFile dataOft 
pOptHeader 
Head DexStringlds 
dexCreateClassLookup() rfi £14} Hidex prreseer DexTypelds 
file 中 的 class 数 据 ， 并 构建 Hash 表 pStringlds DexProtolds 
一 一 一 一 DexFieldlds 
pTypelds DexMethodlds 
pFieldlds 
numEntries 
classDescriptorHash PMethodids dk 
Table classDescriptorffset pProtolds m 
SlassDefOffiet pClassDefs superclassidx 
pLinkData interfacesOf 
: sourceFileldx 
pChasLookup annotationsOfT 
classDataOft 


static Valuesoft 


DexClassDef. . . 


Data 


图 5-1 Dexfile 的 文件 格式 


在 将 dexfile 文件 喘 射 到 内 存 后 ， 会 调用 dexFileParseO) 函 数 对 其 分 析 ， 分 析 的 结果 存放 于 名 
为 DexFile 的 数据 结构 中 。DexFile 中 的 baseAddr 指向 映射 区 的 起 始 位 置 ，pClassDefs 指向 
ClassDefs( 即 class 索引 ) 的 起 始 位 置 。 由 于 在 查找 class 时 ， 都 是 使 用 class 的 名 字 进 行 查找 的 ， 
所 以 为 了 加 快 查找 速度 , 创建 了 一 个 hash A. 在 hash 表 中 对 class 名 字 进 行 hash, 并 生成 index. 
这 些 操 作 都 是 在 对 文件 解析 时 所 完成 的 ， 这 样 虽 然 在 加 载 过 程 中 比较 耗 时 ， 但 是 在 运行 过 程 中 
可 节省 大 量 查找 时 间 。 
解析 完 后， 接 下 来 开始 加 载 class 文件 。 在 此 需要 将 加 载 类 用 ClassObject 来 保存 ， 所 以 在 此 
需要 先 分 析 和 ClassObject 相关 的 几 个 数据 结构 。 
首先 在 文件 Objecth 中 可 以 看 到 如 下 对 结构 体 Object 的 定义 。 
typedef struct Object { 
/* ptr to class object */ 
ClassObject* clazz; 
/* 
* A word containing either a "thin" lock or a "fat" monitor. See 
* the comments in Sync.c for a description of its layout. 
*/ 
u4 lock; 
} Object; 
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通过 结构 体 Object 定义 了 基本 类 的 实现 ， 这 里 有 如 下 两 个 变量 。 
O dock: 对 应 Obejct 对 象 中 的 锁 实现 ， 即 notify wait 的 处 理 。 
O clazz: 是 结构 体 指针 ， 姑 且 不 看 结构 体内 容 ， 这 里 用 了 指针 的 定义 。 
下 面 会 有 更 多 的 结构 体 定义 : 
struct DataObject { 
Object obj; /* MUST be first item */ 


/* variable fof u4 slots; u8 uses 2 slots */ 
u4 instanceData [1]; 
E 
struct StringObject { 
Object obj; /* MUST be first item */ 
/* variable #of u4 slots; u8 uses 2 slots */ 
u4 instanceData [1] ; 
) 
我 们 看 到 最 熟悉 的 一 个 词 StringObject， 把 这 个 结构 体 展开 后 是 下 面 的 样子 。 
struct StringObject { 
/* ptr to class object */ 
ClassObject* clazz; 
/* 
* A word containing either a "thin" lock or a "fat" monitor. See 
* the comments in Sync.c for a description of its layout. 
e 
u4 lock; 


/* variable #of u4 slots; u8 uses 2 slots */ 
u4 instanceData [1]; 
h 
由 此 不 难 发 现 , 任何 对 象 的 内 存 结构 体 中 第 一 行 都 是 Object 结构 体 ， 而 这 个 结构 体 第 一 个 
总 是 一 个 ClassObejct， 第 二 个 总 是 lock。 按 照 C++ 中 的 技巧 ， 这 些 结构 体 可 以 当成 Object 结构 
体 使 用 ， 因 此 所 有 的 类 在 内 存 中 都 具有 “对 象 ”的 功能 ， 即 可 以 找到 一 个 类 (ClassObjecD， 可 以 
有 一 个 锁 (lock)。 
StringObject 是 对 String 类 进行 管理 的 数据 对 象 ，ArrayObejct 是 数据 相关 的 管理 。 


5.5.2 ClassObject 一 一 Class 在 加 载 后 的 表现 形式 


在 解析 完 文件 后 , 接 下 来 需要 加 载 Class 的 具体 内 容 。 在 Dalvik H, 由 数据 结构 ClassObject 
负责 存放 加 载 的 信息 。 如 图 5-2 所 示 ， 加 载 过 程 会 在 内 存 中 alloc 几 个 区 域 ， 分别 存放 
directMethods、virtualMethods、sfields、ifields。 这 些 信 息 是 从 dex 文件 的 数据 区 中 读 取 的 ， 首 
先 会 读 取 Class 的 详细 信息 ， 从 中 获得 directMethod、virtualMethod、sfield、ifield 等 的 信息 ， 然 
后 再 读 取 。 在 此 需要 注意 ， 在 ClassObject 结构 中 有 个 名 为 super 的 成 员 ， 通 过 super 成 员 可 以 指 
向 它 的 超 类 。 
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Dex File 在 内 存 中 的 映射 
(调用 Mmap 函 数 ) 


ClassObject 
DaDa DexOptHeader 
DvmDex |e super 从 DexFile 中 读 取 
| pDexFile directMethods 
| _pHeader virualMetbods 上 一 directMethods | _____ , 
[| pResClasses sficlds Tw | da 
ifields 1 
. i DexStringlds 
itualMethods| ____ ! DexTypelds 
Table DexProtolds 
DexFieldlds 
DesMethodls 
pOptHeader 
Big: 
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[setts | sic Valus OTT 
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E Der DexClassDef.... 
pClassLookup 


图 5-2 加 载 过 程 
5.5.3 findClassNolnit 一 一 加 载 Class 并 生成 相应 ClassObject 的 函数 


在 讲解 完 加 载 数据 结构 的 知识 后 ， 接 下 来 开始 分 析 负 责 加 载 工 作 的 函数 fimdClassNoInitO。 
在 获取 Class 索引 时 ， 会 分 为 基本 类 库 文件 和 用 户 类 文件 两 种 情况 。 在 文件 grund.sh 中 有 如 下 
语句 。 

export 

BOOTCLASSPATH-$bootpath/core.jar:$bootpath/ext.jar:$bootpath/framework.jar:$bootpath 

/android.police.jar 

上 述 语句 指定 了 Dalvik 虚拟 机 所 需 的 基本 库 文件 ， 如 果 没 有 此 语句 ，Dalvik 虚拟 机 在 启动 
过 程 中 就 会 报错 退出 。 

函数 LoadClassFromDex0 会 先 读 取 Class 的 具体 数据 (从 ClassDataoff 处 )， 然 后 分 别 加 载 
directMethod, virtualMethod, ifield 和 sfield. 

为 了 追求 效率 ， 在 加 载 后 需要 将 其 缓存 起 来 ， 以 便 以 后 使 用 方便 。 其 次 ， 在 查找 过 程 中 ， 
如 果 是 顺序 查找 的 话 会 很 慢 ， 所 以 需要 使 用 gDvm.loadedClasses 这 个 Hash 表 来 帮忙 。 如 果 一 个 
子 类 需要 调用 超 类 的 函数 ， 那 它 当然 要 先 加 载 超 类 了 ， 可 能 的 话 甚至 会 加 载 超 类 的 超 类 。 

接 下 来 用 GDB 调试 ， 在 函数 findClassNoInit0 处 设置 断 点 (在 gdb 提示 符 后 输入 “b 
findClassNoInit”)， 在 GDB 提示 符 后 连续 几 次 执行 “c” 和 “bt”。 此 时 可 能 会 出 现 如 下 信息 ， 
可 以 看 到 在 函数 调用 栈 上 可 以 多 次 看 到 findClassNoInit0 函 数 。 


(gdb) bt 


Q^ 
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#0 findClassNoInit (descriptor=0xfef4c7f4 "??????$", loader=0x0, pDvmDex=0x0) 
at dalvik/vm/oo/Class.c:1373 
#1 Oxf6fc4d53 in dvmFindClassNoInit (descriptor=0xf5046a63 "Ljava/lang/Object;", 
loader=0x0) 
at dalvik/vm/oo/Class.c:1194 
#2 0xf6fc6c0a in dvmResolveClass (referrer=0xf5837400, classIdx-290, 
fromUnverifiedConstant=false) at dalvik/vm/oo/Resolve.c:94 
#3 0xf6fc3476 in dvmLinkClass (clazz=0xf5837400, classesResolved=false) 
at dalvik/vm/oo/Class.c:2537 
#4 Oxf6fclb67 in findClassNoInit (descriptor=0xfé6éff0df6  "Ljava/lang/Class;", 
loader=0x0, 
pDvmDex-0xa04c720) at dalvik/vm/oo/Class.c:1489 


5.5.4 ”加 载 基 本 类 库 文件 


接 下 来 从 另 一 个 角度 去 观察 ， 在 文件 class.c 的 2575 行 设置 断 点 ， 然 后 等 待 程序 停 下 。 下 面 
是 clazz 中 的 内 容 。 


(gdb) p clazz-»super-»descriptor 

$6 = 0xf5046a63 "Ljava/lang/Object;" 
(gdb) p clazz-»descriptor 

$7 = 0xf5046121 "Ljava/lang/Class;" 


然后 先 在 findClassNoInit() 函 数 处 设置 断 点 ， 然 后 运行 程序 并 等 待 程序 停 下 。 


(gdb) b findClassNoInit 

Breakpoint 2 at Oxf6fc13e0: file dalvik/vm/oo/Class.c, line 1373. 
(gdb) c 

Continuing. 


看 看 究竟 谁 是 第 一 个 加 载 的 Class. 


(gdb) bt 

#0 findClassNoInit (descriptor-0x0, loader-0x0, pDvmDex-0x0) at dalvik/vm/oo/Class.c:1373 

#1 Oxf6fc32al in dvmLinkClass (clazz-0xf5837350, classesResolved-false) 
at dalvik/vm/oo/Class.c:2491 

42 Oxf6fclb67 in findClassNoInit (descriptor=0xf6fflded "Ljava/lang/Thread;", loader=0x0, 
pDvmDex-0xa04c720) at dalvik/vm/oo/Class.c:1489 

43 0xf6f92692 in dvmThreadObjStartup () at dalvik/vm/Thread.c:328 

#4 Oxf6f800e6 in dvmStartup (argc-2, argv-0xa041190, ignoreUnrecognized-false, pEnv-0xa0411a0) 
at dalvik/vm/Init.c:1155 

#5 Oxf6f8b8e3 in JNI CreateJavaVM (p vm-Oxf6ffOdf6, p env=0xf6ff0df6, vm_args=0xfef4d0b0) 
at dalvik/vm/Uni.c:4198 

#6 0x08048893 in main (argc-3, argv=0xfef4d168) at dalvik/dalvikvm/Main.c:212 


由 上 述 函 数 的 调用 顺序 可 得 出 以 下 内 容 。 
main -> JNI_CreateJavaVM-> dvmStartup-> dvmThreadObjStartup-» dvmFindSystemClassNoInit-> 
findClassNoInit 
在 上 述 调用 栈 中 没有 dvmFindSystemClassNolInit， 是 因为 编译 器 将 其 作为 inline 优化 了 ， 导 
$t GDB 看 不 到 有 dvmFindSystemClassNolInit 的 栈 。 但 是 不 要 担心 ， 我 们 可 以 从 回溯 栈 中 看 到 
dvmFindSystemClassNoInit。 
«Q 


IT 


D 深入 理解 Android 虚拟 机 -f 


ere 


5.5.5 ”加 载 用 户 类 文件 


在 加 载 用 户 类 文件 时 ， 会 先 加 载 一 个 Class， 然 后 由 这 个 Class 负责 用 户 类 文件 的 加 载 ， 而 
这 个 Class 又 会 通过 INT 的 方式 去 调用 findClassNoInit。 具 体 加 载 过 程 和 前 面 介绍 的 基本 类 库 加 
载 类 似 ， 读 者 可 以 参考 前 面 的 知识 来 理解 。 此 处 不 再 详细 介绍 。 


5.6 解释 执行 类 


在 加 载 类 文件 后 ，Dalvik 虚拟 机 接 下 来 需要 解释 并 执行 这 些 类 。 本 节 将 简要 介绍 Dalvik 虚 
拟 机 解释 并 执行 类 的 基本 流程 。 


5.6.1 Dalvik 虚拟 机 字 节 码 和 JVM 字 节 码 的 区 别 


在 了 解 Dalvik 虚拟 机 解释 类 的 工作 前 ， 需 要 先 了 解 Dalvik 字 节 码 和 JVM 字 节 码 的 区 别 。 

Android 程序 通常 用 Java 语言 编写 ， 用 Dalvik 虚拟 机 运行 ， 这 和 传统 的 VM(Java Virtual 
Machine) 有 所 区 别 。Dalvik 虚拟 机 是 Google 公司 专门 为 Android 系统 开发 的 Java 虚拟 机 ， 针 对 
移动 平台 的 特点 做 了 优化 ,在 Dalv 还 虚拟 机 上 运行 的 字 节 码 是 dex 格式 的 ,用 工具 dx A Java class 
文件 转换 得 到 。 传 统 JVM 字 节 码 格式 即 为 .class 文件 。 

如 果 想 要 研究 Android 程序 的 逆向 、 反 编译 器 、 字 节 码 动静 态 插 桩 等 技术 ， 就 有 必要 了 解 
一 下 Dalvik 字 节 码 的 格式 了 。Dalvik 虚拟 机 和 JVM 字 节 码 的 区 别 如 下 。 

(1) 程序 结构 不 同 

JVM 字 节 码 由 .class 文件 组 成 ， 每 个 文件 一 个 class。JVM 在 运行 的 时 候 为 每 一 个 类 装载 字 
节 码 。 相 反 的 ，Dalvik 程序 只 包含 一 个 .dex 文件 ， 这 个 文件 包含 了 程序 中 所 有 的 类 。 如 图 5-3 
所 示 为 生成 .dex 文件 的 过 程 。 


5-3 ”生成 .dex 文件 的 过 程 


Java 编译 器 创建 了 JVM 字 节 码 之 后 ，Dalvik 的 dx 编译 器 删除 .class 文件 ， 重 新 把 它们 编译 
成 Dalvik 字 节 码 ， 然 后 把 它们 写 进 一 个 .dex 文件 中 。 这 个 过 程 包括 翻译 、 重 构 、 解 释 程序 的 基 
本 元 素 (常量 池 、 类 定义 、 数 据 段 )。 常量 池 描 述 了 所 有 的 常量 , 包括 引用 、 方 法 名 、 数 值 常量 等 。 
类 定义 包括 了 访问 标志 、 类 名 等 基本 信息 。 数 据 段 中 包含 各 种 被 VM 执行 的 函数 代码 以 及 类 和 
函数 的 相关 信息 (例如 Dalvik 虚拟 机 所 需要 的 寄存 器 数量 、 局 部 变量 表 、 操 作 数 堆栈 大 小 )， 还 


Q^ 
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有 实例 变量 。 

Q) 寄存 器 结构 不 同 

Dalvik 虚拟 机 是 基于 寄存 器 的 , 但 是 JVM 是 基于 堆栈 的 。JVM 字 节 码 中 ,局 部 变量 会 被 放 
入 局 部 变量 表 中 ， 继 而 被 压 入 堆栈 供 操作 码 进行 运算 ， 当 然 JVM 也 可 以 只 使 用 堆栈 而 不 显 式 地 
将 局 部 变量 存 入 变量 表 中 。Dalvik 虚拟 机 字 节 码 中 ， 局 部 变量 会 被 赋 给 65536 个 可 用 的 寄存 器 
中 的 任何 一 个 ，Dalvik 虚拟 机 指令 直接 操作 这 些 寄存 器 ， 而 不 是 访问 堆栈 中 的 元 素 。 

G) 指令 集 不 同 

Dalvik 虚拟 机 有 218 个 操作 码 ， 而 Java 虚拟 机 有 200 个 ， 并 且 二 者 本 质 上 完全 不 同 。 比 如 ， 
Java 虚拟 机 有 10 多 个 操作 码 用 于 堆栈 和 本 地 变量 表 的 数据 转移 而 Dalvik 虚拟 机 完全 没有 。 
Dalvik 虚拟 机 指令 要 比 Java 指令 更 长 ， 因 为 它们 经 常 包含 了 寄存 器 的 源 地 址 和 目标 地 址 。 因 此 
Dalvik 虚拟 机 需要 更 少 的 指令 。 平 均 来 讲 ，Dalvik 虚拟 机 字 节 码 程序 指令 数 要 比 Java 少 3096, 
但 是 程序 要 大 35% 左 右 。 

(4) 常量 池 结 构 不 同 

JVM 字 节 码 中 许多 .class 文件 中 重复 常量 池 ， 比 如 重复 引用 函数 的 名 字 。dx 编译 器 消除 了 
这 些 重复 。Dalvik 虚拟 机 使 用 了 一 个 常量 池 供 所 有 的 class 同时 引用 。 除 此 之 外 ，dx 通过 内 联 技 
术 消 除了 一 些 常量 。 在 实际 中 ， 整 数 、 长 整数 、 单 精度 和 双 精 度 浮 点 常量 在 这 个 过 程 中 消失 了 。 

(5) 模糊 不 清 的 基本 类 型 不 同 

JVM 的 整数 赋值 和 单 精 度 浮 点 赋值 采用 不 同 的 操作 码 ， 长 整数 赋值 和 双 精 度 赋 值 也 不 同 ; 
而 Dalvik 虚拟 机 使 用 相同 的 操作 码 来 对 整数 和 浮 点 进行 赋值 。 

(6) 空 引用 不 同 

Dalvik 虚拟 机 字 节 码 并 没有 一 个 特定 的 空 类 型 ， 而 是 用 常量 0 来 取代 。 这 样 ， 反 编译 时 ， 
常量 0 的 模糊 不 清 的 含义 就 应 当 被 正确 地 区 分 。 

(7) 类 型 引用 的 不 同 

Java 字 节 码 对 对 象 引用 的 比较 和 空 类 型 比较 使 用 不 同 的 操作 码 ， 而 Dalvik 虚拟 机 只 用 了 一 
个 操作 码 来 进行 简化 。 因 此 如 果 做 反 编 译 ， 就 必须 还 原 比较 对 象 的 类 型 信息 。 

(8) 数组 原始 类 型 的 存储 不 同 

Davik 虚拟 机 使 用 不 明确 的 操作 码 来 进行 数组 操作 (比如 aget 和 aget-wide)， 而 JVM 在 这 点 
上 是 明确 的 。 因 此 如 果 要 做 反 编 译 ， 数 组 类 型 信息 必须 还 原 。 


5.6.2 Davik 虚拟 机 的 解释 器 优化 


Dalvik 虚拟 机 的 主要 工作 就 是 解释 执行 Davik 虚拟 机 特有 的 Java 字 节 码 一 一 dex 字 节 码 。 
解释 器 就 是 Dalvik 虚拟 机 的 核心 部 分 事实 上 ,我们 用 Android 自 带 系统 工具 监测 caffeinmark( 虚 
拟 机 测试 程序 ) 会 发 现 ， 解 释 器 部 分 的 调用 占 整 个 应 用 的 90% 以 上 ， 再 加 上 几 个 调用 较 多 的 小 函 
数 块 ， 调 用 时 间 竟 然 占 98% 以 上 。 尽 管 这 部 分 的 代码 占 整个 Dalvik 虚拟 机 代码 很 小 的 一 部 分 ， 
但 这 部 分 代码 的 能 量 确实 大 得 惊人 ，Dalvik 虚拟 机 的 优化 工作 就 是 围绕 它 展开 的 。 对 解释 器 进 
行 优化 后 ， 性 能 至 少 有 50% 的 提升 。 

在 Android 源码 中 , 针对 ARM 平台 中 为 我 们 提供 了 好 几 种 解释 器 的 实现 。 其 中 包括 标准 的 
可 移植 型 解释 器 和 快速 型 解释 器 ， 这 两 种 解释 器 的 实现 分 别 是 C 和 汇编 语言 。 从 
/dalvik/vm/dvm.mk. 目录 中 的 内 容 可 以 知道 ， 这 两 种 解释 会 同时 编译 到 libdvm.so 中 。Dalvik 虚 
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拟 机 这 个 可 执行 文件 对 dex 进行 处 理 时 , 会 默认 选择 快速 型 解释 器 。 当 在 做 好 的 Android 文件 系 
统 /data/ 的 位 置 增加 一 个 文件 local.prop( 文 件 的 内 容 为 dalvik.vm.execution-mode = int:portable) 后 ， 
重启 系统 ， 通 过 测试 Dalvik 虚拟 机 的 性 能 我 们 就 能 发 现 Dalvik 虚拟 机 的 性 能 有 明显 的 下 降 ， 这 
就 可 以 确定 默认 的 解释 器 是 可 移植 型 解释 器 了 。 

现在 我 们 来 分 析 一 下 应 该 怎么 进行 Dalvik 虚拟 机 的 优化 工作 。 首 先 ， 我 们 最 容易 想到 的 就 
是 将 可 移植 型 解释 器 全 部 用 汇编 实现 。 这 条 技术 路 线 是 可 行 的 ， 但 它 的 工作 量 有 多 大 了 呢 ? 标准 
型 解释 器 的 代码 虽然 不 多 ， 但 将 它们 全 部 用 汇编 实现 可 不 是 那么 容易 的 事情 ， 这 还 不 是 最 难 的 ， 
最 难 的 是 怎么 如 何 进行 调试 。 将 它们 全 部 翻译 成 汇编 后 再 调试 ? 这 个 调试 工作 估计 谁 也 不 愿意 
去 干 。 因 此 ， 必 须 编 译 出 一 个 汇编 、C 语言 混合 实现 的 解释 器 ， 只 要 此 技术 路 线 通 了 ， 优 化 的 
工作 就 能 按部就班 地 进行 。 再 对 汇编 、C 语言 混合 的 比例 加 以 控制 ， 我 们 就 可 以 用 一 条 汇编 优 
化 解释 器 指令 实时 地 进行 调试 。 此 技术 路 线 在 6410 开发 板 上 顺利 的 拉 通 了 。 幸 运 的 是 ， 在 非 
ARM 架构 的 开发 板 上 没有 遇 到 新 的 问题 ， 因 此 优化 的 进度 一 直 在 掌控 之 中 。 

当然 ， 优 化 的 过 程 并 不 是 一 帆 风 顺 的 。 首 先 ， 非 ARM 架构 的 优化 当然 使 用 的 是 非 ARM 的 
汇编 语言 ， 在 以 ARM 架构 DalvikVM 为 参照 时 ， 为 了 表达 相同 的 意思 ， 就 不 得 不 绕 过 一 些 只 针 
对 ARM 才 有 的 汇编 语句 。 毕 竟 , DalvikVM 解释 器 的 架构 以 及 解释 器 指令 实现 的 功能 是 确定 的 、 
与 架构 无 关 的 。 

其 次 ， 在 优化 前 期 ， 寄 存 器 的 分 配 出 现 了 小 小 的 问题 。Dalvik 虚拟 机 是 基于 寄存 器 的 ， 所 
谓 的 基于 寄存 器 是 指 用 当前 硬件 环境 下 的 若干 个 真实 寄存 器 来 用 作 固 定 的 用 途 。 当 然 ， 这 若干 
个 寄存 器 在 使 用 前 是 要 压 栈 保存 的 ， 例 如 虚拟 机 中 的 PC. FP 等 。 所 以 说 , 虽然 虚拟 机 中 的 PC、 
FP 等 都 是 模拟 的 ， 但 每 一 个 模拟 的 寄存 器 对 应 都 一 个 真实 的 寄存 器 。 这 若干 个 寄存 器 在 模拟 虚 
拟 机 中 的 寄存 器 时 最 好 在 一 个 头 文件 中 规划 好 。 说 实话 ，Dalvik 虚拟 机 还 算 不 上 是 纯粹 的 基于 
寄存 器 的 虚拟 机 ， 毕 竟 每 个 解释 器 指令 所 带 的 操作 数 (不 管 是 源 操 作 数 还 是 目的 操作 数 ， 不 管 是 
“立即 数 ” 还 是 “寄存 器 ”) 都 是 存放 在 以 FP( 虚 拟 机 中 的 FP) 为 基 址 的 堆栈 中 。 若 是 硬件 条 件 多 
许 一 一 有 足够 多 的 寄存 器 ，Dalvik 虚拟 机 的 性 能 将 会 再 上 一 个 台阶 。 足 够 多 的 寄存 器 肯定 是 奢 
望 , 但 是 比 ARM 多 几 个 寄存 器 的 芯片 还 是 有 的 ， 比 如 某 款 国产 CPU 就 拥有 32 个 寄存 器 ， 若 是 
加 以 利用 ， 效 果 可 想 而 知 。 


Q^ 
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dex 文件 是 Android 系统 中 的 一 种 文件 ， 是 一 种 特殊 的 数据 格式 ， 和 APK、jar 等 格式 文件 
类 似 。 使 用 dex 文件 的 最 大 目的 是 实现 安全 管理 ， 但 在 追求 安全 的 前 提 下 ， 一 定 要 注意 对 dex 
文件 实现 优化 处 理 。 在 本 章 的 内 容 中 ， 将 详细 讲解 dex 文件 的 基本 知识 ， 并 简要 讲解 优化 dex 
文件 的 基本 流程 ， 为 读者 步 入 本 书后 面 知识 的 学 习 打 下 基础 。 


6.1 Android dex 文件 优化 简介 


对 Android dex 文件 进行 优化 来 说 ， 需 要 注意 的 一 点 是 dex 文件 的 结构 是 紧凑 的 ， 但 是 我 们 
还 是 要 想方设法 地 进行 提高 程序 的 运行 速度 ， 我 们 就 仍然 需要 对 dex 文件 进行 进一步 优化 。 

调整 所 有 字段 的 字 节 序 (LITTLE_ENDIAN)， 和 对 齐 结构 中 的 每 一 个 域 来 验证 dex 文件 中 的 
所 有 类 ， 并 对 一 些 特定 的 类 进行 优化 或 对 方法 里 的 操作 码 进行 优化 。 优 化 后 的 文件 大 小 会 有 所 
增加 ， 大 约 是 原 Android dex 文件 的 1 一 4 倍 。 优 化 发 生 的 时 机 有 两 个 ， 其 中 对 于 预 置 应 用 来 说 ， 
可 以 在 系统 编译 后 ， 生 成 优化 文件 ， 以 ODEX 结尾 。 这 样 在 发 布 时 除 APK 文件 (不 包含 dex) 以 
外 ， 还 有 一 个 相应 的 Android dex 文件 ， 对 于 非 预 置 应 用 ， 包 含 在 APK 文件 里 的 dex 文件 会 在 
运行 时 被 优化 ， 优 化 后 的 文件 将 被 保存 在 缓存 中 。 

每 一 个 Android 应 用 都 运行 在 一 个 Dalvik 虚拟 机 实例 里 ， 而 每 一 个 虚拟 机 实例 都 是 一 个 独 
立 的 进程 空间 。 虚 拟 机 的 线程 机 制 ， 内 存 分 配 和 管理 ，Mutex 等 都 是 依赖 底层 操作 系统 而 实 
现 的 。 
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实例 都 和 Zygote 共享 一 块 内 存 区 域 ， 大 大 节省 了 内 存 开销 。Android 应 用 开发 和 Dalvik 虚拟 机 
Android 应 用 所 使 用 的 编程 语言 是 Java 语言 ， 和 Java SE 一 样 ， 编 译 时 使 用 Oracle IDK 将 Java 
源 程序 编程 成 标准 的 Java 字 节 码 文件 (.class 文件 )。 而 后 通过 工具 软件 DX 把 所 有 的 字 节 码 文件 
转 成 Android dex 文件 (classes.dex)。 最 后 使 用 Android 打包 工具 (aapt) 将 dex 文件 、 资源 文件 以 及 
AndroidManifestxml 文件 (二 进 制 格式 ) 组 合成 一 个 应 用 程序 包 (APK)。 应 用 程序 包 可 以 被 发 布 到 


6.2 dex 文件 的 格式 


假设 存在 Java 文件 testjava， 其 代码 如 下 。 


class test( 
public static void main(String[] argc)( 
System.out.println("test!"); 
} 


} 
通过 如 下 命令 可 以 得 到 dex 文件 。 


$ javac test.java 
$ dx --dex --output-test.dex test.class 
$ hexdump test.dex 


dex 文件 test.dex 的 内 容 如 下 。 


0000000 6564 0a78 3330 0035 5eb4 4f7a 94e6 65f0 
0000010 fb3e d5f3 e185 dd62 fce7 c887 a7ec 5329 
0000020 02d8 0000 0070 0000 5678 1234 0000 0000 
0000030 0000 0000 0238 0000 000e 0000 0070 0000 
0000040 0007 0000 00a8 0000 0003 0000 00c4 0000 
0000050 0001 0000 00e8 0000 0004 0000 00f0 0000 
0000060 0001 0000 0110 0000 01a8 0000 0130 0000 
0000070 0176 0000 017e 0000 0195 0000 01a9 0000 
0000080 01bd 0000 01d1 0000 01d9 0000 01dc 0000 
0000090 01e0 0000 O1f5 0000 01fb 0000 0200 0000 
00000a0 0209 0000 0210 0000 0001 0000 0002 0000 
00000b0 0003 0000 0004 0000 0005 0000 0006 0000 
00000cO 0008 0000 0006 0000 0005 0000 0000 0000 
00000d0 0007 0000 0005 0000 0168 0000 0007 0000 
00000e0 0005 0000 0170 0000 0003 0000 000a 0000 
00000£0 0000 0001 000b 0000 0001 0000 0000 0000 
0000100 0004 0000 0000 0000 0004 0002 0009 0000 
0000110 0004 0000 0000 0000 0001 0000 0000 0000 
0000120 000d 0000 0000 0000 0227 0000 0000 0000 
0000130 0001 0001 0001 0000 021b 0000 0004 0000 
0000140 1070 0001 0000 000e 0003 0001 0002 0000 
0000150 0220 0000 0008 0000 0062 0000 011a 000c 
0000160 206e 0000 0010 000e 0001 0000 0002 0000 
0000170 0001 0000 0006 3c06 6e69 7469 003e 4c15 


0000180 
0000190 
00001a0 
00001b0 
00001c0 
00001d0 
00001e0 
00001f0 
0000200 
0000210 
0000220 
0000230 
0000240 
0000250 
0000260 
0000270 
0000280 
0000290 
00002a0 
00002b0 
00002c0 
00002d0 
00002d8 


616a 
6165 
4f2f 
616c 
7661 
0600 
5b13 
6e69 
7007 
7409 
0103 
0102 
0001 
0070 
0003 
0001 
00f0 
2001 
0002 
0176 
2000 
0001 


6176 
3b6d 
6a62 
676e 
2f61 
744c 
6a4c 
3b67 
6972 
7365 
0700 
c809 
0000 
0000 
0000 
0000 
0000 
0000 
0000 
0000 
0000 
0000 


692f 
1200 
6365 
532f 
616c 
7365 
7661 
0400 
746e 
2e74 
780e 
0002 
0000 
0002 
0003 
00e8 
0006 
0002 
0168 
2003 
0001 
0238 


2f6f 7250 6e69 
6a4c 7661 2f61 
3b74 1200 6a4c 
7274 6e69 3b67 
676e 532f 7379 
3b74 0100 0056 
2f61 616c 676e 
616d 6e69 0300 
6e6c 0500 6574 
616a 6176 0100 
0000 0200 0200 
0000 000d 0000 
0000 0001 0000 
0000 0007 0000 
0000 00c4 0000 
0000 0005 0000 
0000 0001 0000 
0000 0130 0000 
0000 2002 0000 
0000 0002 0000 
0000 0227 0000 
0000 


5374 
616c 
7661 
1200 
6574 
5602 
532f 
756f 
7473 
0700 
8080 


7274 
676e 
2f61 
6a4c 
3bed 
004c 
7274 
0074 
0021 
000e 
b004 


0000 0000 


000e 
00a8 
0004 
0004 
0110 
1001 
000e 
021b 
1000 


接 下 来 开始 分 析 这 个 DEX 文件 的 具体 格式 。 


6.2.1 map_list 


map list 数据 结构 如 表 6-1 所 示 。 


表 6-1 map_list 数据 结构 


0000 
0000 
0000 
0000 
0000 
0000 
0000 
0000 
0000 
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第 一 项 为 map_list 的 大 小 ， 其 中 map. item 的 结构 为 如 表 6-2 所 示 。 


表 6-2 map item 的 结构 


名 F 式 
type ushort 
unused ushort 
Size uint 
offset uint 


type 的 值 如 表 6-3 所 示 。 


«Q 


Q^ 
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6-3 type 的 值 

Item 类 型 常 E 值 ltem 的 大 小 (Bytes) 
header item TYPE HEADER ITEM 0x0000 | 0x70 
string id item TYPE STRING ID ITEM Ox0001 | 0x04 
type id item TYPE TYPE ID ITEM 0x0002 | 0x04 
proto_id item TYPE PROTO ID ITEM 0x0003 Ox0c 
field id item TYPE FIELD ID ITEM 0x0004 | 0x08 
method id item TYPE METHOD ID ITEM 0x0005 | 0x08 
class def item TYPE CLASS DEF ITEM 0x0006 | 0x20 
map_list TYPE MAP LIST 0x1000 4+ (item.size * 12) 
type list TYPE TYPE LIST Ox1001 | 4+ (item size * 2) 
annotation set ref list TYPE ANNOTATION SET REF LIST | 0x1002 4 * (item.size * 4) 
annotation set item TYPE ANNOTATION SET ITEM 0x1003 4 + (item.size * 4) 
class_data_item TYPE CLASS DATA ITEM 0x2000 implicit; must parse 
code_item TYPE_CODE_ITEM 0x2001 implicit; must parse 
string data item TYPE STRING DATA ITEM 0x2002 implicit; must parse 
debug info item TYPE DEBUG INFO ITEM 0x2003 implicit; must parse 
annotation item TYPE ANNOTATION ITEM 0x2004 implicit; must parse 


encoded array item 


annotations directory item 


TYPE ENCODED ARRAY ITEM 


TYPE ANNOTATIONS DIRECTORY 
_ITEM 


0x2006 


implicit; must parse 


implicit; must parse 


这 个 map_list 有 13 个 map item， 上 有 具体 说 明 如 表 6-4 所 示 。 


表 6-4 13 个 map_item 


ff 类 型 小 偏 移 
0x0000 header_item 0x0 
0x0001 string id item 0x70 
0x0002 type id item Oxa8 
0x0003 proto_id item Oxc4 
0x0004 field id item Oxe8 
0x0005 method id item Oxfo 
0x0006 class def item Ox110 
0x2001 code item. 0x130 
0x1001 type_list 0x168 
0x2002 string data item 0x176 
0x2003 debug info item Ox21b 
0x2000 class data item 0x227 
0x1000 map_list 0x238 
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由 此 可 以 看 出 ， 表 中 的 size 和 offset 和 header item 中 的 值 一 致 。 


6.2.2 string id item 


在 前 面 的 test.dex 文件 中 ， 通 过 第 三 行 中 的 “0070 0000” £5 string id 列表 的 位 置 为 0x70, 
通过 第 三 行 的 “000e 0000” 得 出 string id 列表 中 string id item 的 数量 为 0xe。string id 的 结构 为 
string id item， 其 格式 说 明 如 表 6-5 所 示 。 


表 6-5 格式 说 明 


string data off uint 


string data off 指向 string 的 数据 ，string 的 数据 结构 为 string. data_item， 其 格式 说 明 如 
表 6-6 所 示 。 


表 6-6 格式 说 明 
名 字 格 式 
utfl6 size uleb128 
data ubyte[] 
每 个 LEB128 由 1—5 个 字 节 组 成 ， 所 有 字 节 组 合 到 一 起 代表 一 个 32 位 值 。 除 了 最 后 一 个 
字 节 的 最 高 标志 位 为 0， 其 他 的 为 1。 剩 下 的 7 位 表示 有 效 负荷 (符号 位 取决 于 最 后 字 节 的 有 效 负 


荷 最 高 位 )， 第 二 个 字 节 的 7 位 接 上 。 有 符号 LEB128 的 符号 由 最 后 字 节 的 有 效 负 荷 最 高 位 决定 。 
如 图 6-1 所 示 。 
Bitwise diagram of a two-byte LEB128 value 
First byte Second byte 
1 bit, bit. bit, bit, bit, bit, bit; | 0 bit, bit,, bit, bit, bit, bit, bit, 
图 6-1 LEB128 数据 类 型 


如 果 是 有 符号 的 LEB128， 符 号 位 取决 于 bit13， 如 表 6-7 所 示 。uleb128p1 的 值 加 1 表示 为 
uleb128. 


36-7 LEB128 的 扩展 


Encoded Sequence As sleb128 As uleb128 


从 文件 的 0x70 得 出 string id 的 列表 如 下 ， 共 有 14 个 string id item. 


0176 0000 017e 0000 0195 0000 01a9 0000 


«9 
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O1bd 0000 01d1 0000 01d9 0000 Olde 0000 
01e0 0000 O1f5 0000 01fb 0000 0200 0000 
0209 0000 0210 0000 


例如 : 
(1) String Data 在 0x176 处 ， 可 以 从 文件 的 0x176 得 到 以 下 数据 ， 以 0 结尾 。 


3c06 6e69 7469 003e 


先 读 取 第 一 个 字 节 为 0x06， 得 出 String Data 的 长 度 为 6， 所 以 String Data 的 ASCI 码 序列 


为 3c 69 6e 69 74 3e 得 到 <init>。 


(2) String Data 在 Ox17e 处 ， 可 以 从 文件 的 0xl7e 得 到 以 下 数据 ， 以 0 结尾 。 
4c15 616a 6176 692f 2f6f 7250 6e69 5374 7274 6165 3b6d 12 00 


先 读 取 第 一 个 字 节 为 0x15, 得 出 String Data 的 长 度 为 21, 所 以 String Data 的 ASCI 码 序列 


为 Ac 6a 61 76 61 2f 69 6f 2f 50 72 69 6e 74 53 74 72 65 61 6d 3b 得 到 Ljava/io/PrintStream， 以 此 类 
推 ， 可 以 得 到 其 他 String Data. 


Q^ 


(3) 6a4c 7661 2f61 616c 676e 4Pf 6262 6365 3b74 得 到 Ljava/lang/Object; o 
(4) 6a4c 7661 2f61 616c 676e 532f 7274 6e69 3b67 得 到 Ljava/lang/String; 。 
(5) 6a4c 7661 2f61 616c 676e 532f 7379 6574 3b6d 得 到 Ljava/lang/System: « 
(6) 744c 7365 3b74 得 到 Ltest. 

(7) 56 得 到 V。 

(8) 564c 得 到 VL。 

(9) 5b 6a4c 7661 2f61 616c 676e 532f 7274 6e69 3b67 得 到 [Ljava/lang/String. 
(10) 616d 6e69 得 到 main。 

(11) 756f 74 得 到 out。 

(12) 70 6972 746e 6e6c 得 到 printin. 

(13) 6574 7473 21 得 到 test! o 

(14) 74 7365 2e74 616a 6176 得 到 testjava。 

具体 的 算法 实现 位 与 libdex\Leb128.h 中 的 相似 ， 实 现代 码 如 下 。 

DEX INLINE int readUnsignedLeb128 (const ul** pStream) { 


const ul* ptr = *pStream; 
int result = *(ptr++); 


if (result > Ox7f) (  // 如 果 第 一 个 字 节 的 最 高 位 是 1 
int cur = *(ptr++) ; // 指 向 第 二 个 字 节 
// 当 前 值 是 第 一 个 字 节 的 7 位 加 上 第 二 个 字 节 的 7 位 
result = (result & Ox7f) | ((cur & Ox7f) << 7); 
if (cur > 0x7f) ( // 如 果 第 二 个 字 节 的 最 高 位 是 1 
cur = *(ptr++); // 指 向 第 三 个 字 节 
result |= (cur & 0x7f) << 14;// 当 前 值 加 上 第 三 个 字 节 的 7 位 
if (cur > 0x7f) {// 如 果 第 三 个 字 节 的 最 高 位 是 1 
cur = *(ptr++); 
result |= (cur & 0x7f) << 21;// 当 前 值 加 上 第 四 个 字 节 的 7 位 
if (cur > Ox7f) {// 如 果 第 四 个 字 节 的 最 高 位 是 1 
/* 


* Note: We don't check to see if cur is out of 
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* range here, meaning we tolerate garbage in the 
* high four-order bits. 

t7 

cur = *(ptr++); 


result |= cur << 28;// 当 前 值 加 上 第 五 个 字 节 的 7 位 


*pStream = ptr; 
return result; 


} 


/* 
* 读 取 有 符号 的 ， 符 号 位 取决 于 最 后 字 节 的 有 效 负荷 最 高 位 。>> 是 到 符号 的 。 
* 
/ 
DEX INLINE int readSignedLeb128 (const ul** pStream) { 
const ul* ptr - *pStream; 
int result = *(ptr++); 


if (result <= 0x7f) { 


result = (result << 25) >> 25; 
} else { 
int cur = *(ptr++); 
result = (result & Ox7f) | ((cur & Ox7f) << 7); 
if (cur <= 0x7f) { 
result = (result << 18) >> 18; 
} else { 
cur = *(ptr++); 
result |= (cur & Ox7f) << 14; 
if (cur <= Ox7f) { 
result = (result << 11) >> 11; 
} else { 
cur = *(ptr++); 
result |= (cur & Ox7f) << 21; 


if (cur <= 0x7f) { 
result = (result << 4) >> 4; 
} else { 
/* 
* Note: We don't check to see if cur is out of 
* range here, meaning we tolerate garbage in the 
* high four-order bits. 


e 
cur = *(ptr++); 
result |= cur << 28; 


*pStream = ptr; 
return result; 


<® 
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} 
/* 
* 读 取 并 验证 无 符号 的 Leb128。 
calf 
int readAndVerifyUnsignedLeb128 (const ul** pStream, const ul* limit, 
bool* okay) ; 
/* 
* 读 取 并 验证 有 符号 的 Leb128。 
zl) 
int readAndVerifySignedLeb128 (const ul** pStream, const ul* limit, bool* okay); 
/* 
* 写 入 无 符号 的 Leb128 
cf 
DEX INLINE ul* writeUnsignedLeb128(ul* ptr, u4 data) 
{ 
while (true) { 
ul out = data & Ox7f; 
if (out !- data) ( 
*ptr++ = out | 0x80; 
data »»- 7; 
) eise ( 
*ptr++ = out; 
break; 


} 


return ptr; 


} 

/* 

* Rot 

t 

DEX INLINE int unsignedLeb128Size(u4 data) 


{ 


int count = 0; 


do { 
data >>= 7; 
count++; 

} while (data != 0); 


return count; 


} 
找到 文件 libdex\DexFile.h 和 libdex\DexFile.c, .dex 文件 会 被 映射 到 DexMapList， 其 定义 结 
构 体 的 代码 如 下 。 


typedef struct DexMapList { 


u4 size; /* #of entries in list */ 
DexMapItem list [1]; /* entries */ 
} DexMapList; 


size 表示 map list 的 大 小 ， 即 条 目 数 ; DexMapltem 结构 体 表 示 单 个 条 目 ， 其 定义 代码 如 下 。 


©> 
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typedef struct DexMapItem { 
u2 type; /* type code (see kDexType* above) */ 
u2 unused; 
u4 size; /* count of items of the indicated type */ 
u4 offset; /* file offset to the start of data */ 


) DexMapItem; 
而 结构 体 DexHeader 存储 了 各 个 数据 类 型 的 真实 地 址 和 偏 移 量 等 信息 , 其 定义 代码 如 下 。 


typedef struct DexHeader { 


ul magic [8] ; /* includes version number */ 

u4 checksum; /* adler32 checksum */ 

ul signature[kSHAlDigestLen]; /* SHA-1 hash */ 

u4 fileSize; /* length of entire file */ 

u4 headerSize; /* offset to start of next section */ 
u4 endianTag; 

u4 linkSize; 

u4 linkoff; 

u4 mapOff; 


u4 stringIdsSize; 
u4 stringIdsOff; 
u4 typeldsSize; 
u4 typeIdsOff; 
u4 protoIdsSize; 
u4 protoIdsOff; 
u4 fieldIdsSize; 
u4 fieldIdsOff; 
u4 methodIdsSize; 
u4 methodIdsOff; 
u4 classDefsSize; 
u4 classDefsOff; 
u4 dataSize; 
u4 dataoff; 

) DexHeader; 


6.2.3 type id item 
由 第 5 行 的 “00a8 0000" (i type id 列表 的 位 置 为 0xa8， 由 第 5 行 的 “0007 0000" ii 
type id 列表 中 type id item 的 数量 为 0x7。type id 的 结构 为 type id item， 如 表 6-8 所 示 。 
表 6-8 type id item 


a F 格 式 


descriptor idx uint 


descriptor idx 7j String id 列表 的 索引 如 下 。 
0001 0000 0002 0000 0003 0000 0004 0000 0005 0000 0006 0000 0008 0000 
依次 代表 : Ljava/io/PrintStream, Ljava/lang/Object, Ljava/lang/String, Ljava/lang/System, 


Ltest, V [Ljava/lang/String。 
Type id list 列表 如 表 6-9 所 示 。 


<@ 
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表 6-9 Type id list 列表 


0 Ljava/io/PrintStream: 


Ljava/lang/Object: 


Ljava/lang/String: 


1 | 
2 | 
3 | Ljava/lang/System: 
4 | 
s | 


6.2.44 proto id item 


由 第 5 行 的 “00c4 0000” 得 出 prototype id 列表 的 位 置 为 0xc4， 第 5 行 的 “0003 0000" Ab 
prototype id 列表 中 proto id item 的 数量 为 Ox3. prototype id 的 结构 为 proto_id_item， 如 表 6-10 
所 示 。 


表 6-10 proto id item 


名 F 格 式 
shorty idx uint 
retum type idx uint 
parameters off uint 


shorty idx 为 String Id 列表 的 索引 ，return_type_idx 为 Type Id 列表 的 索引 ，parameters_off 
指向 type_list。type_list 结构 如 表 6-11 所 示 。 


表 6-11 type list 结构 


名 F 格 式 
Size uint 
list type item[size] 
type item 结构 如 表 6-12 所 示 。 
表 6-12 type item 结构 
名 字 格 式 


type idx ushort 


type idx 为 type id 列表 的 索引 。 

从 文件 的 0xc4 得 到 prototype id 列表 如 下 ， 共 有 三 个 proto_ id item. 

(1) 0006 0000 0005 0000 0000 0000 

string id_list[0x6] 代 表 V， 返 回 类 型 type id list[0xs] 代 表 V， 没 有 参数 。 

(2) 0007 0000 0005 0000 0168 0000 

string id_list[0x7] 代 表 VL， 返 回 类 型 type id_list[0x5] 代 表 V， 参 数 从 0x168 处 的 值 为 0001 


Q^» 
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0000 0002， 索 引 为 0x52，type id list[0x2] 代 表 Ljava/lang/String:。 
(3) 0007 0000 0005 0000 0170 0000 
string id list[0x7] 代 表 VL， 返 回 类 型 type_id_list[0x5] 代 表 V， 参 数 从 0x170 处 的 值 为 0001 
0000 0006， 索 引 为 0&6，type id list[0x6] 代 表 [Ljava/lang/String;。 


6.2.5 field id item 


由 第 6 行 的 “00e8 0000” 得 出 field id 列表 的 位 置 为 0xe8, 由 第 6 行 的 “0001 0000” Xb field 
id 列表 中 field id item 的 数量 为 0&1。Field id 的 结构 为 field id item， 如 表 6-13 所 示 。 


表 6-13 field id item 


class idx 
type idx 
name idx 
O class idx: 表示 类 的 类 型 ， 即 该 字段 所 属 的 类 。 

O type idx: 表示 此 字段 的 类 型 。 

口 name idx: 表示 此 字段 的 名 字 。 

从 文件 的 0xe8 得 到 如 下 filed id 的 列表 。 

0003 0000 000a 0000 

由 此 可 见 ， 共 有 1 个 field id item。 该 字段 所 属 的 类 为 Ljava/lang/System;， 此 字段 的 类 型 为 

Ljava/io/PrintStream;， 此 字段 的 名 字 为 out。 


6.2.6 method id item 


由 第 6 行 的 “00f0 0000” 得 出 method id 列表 的 位 置 为 0xf0, 第 6 行 “0004 000” 4b method 
id 列表 中 method id item 的 数量 为 0x4。Method id 的 结构 为 method id item, Jn 6-14 所 示 。 


表 6-14 method id item 


名 F 格 式 
class idx ushort 
proto_idx ushort 
name_idx uint 


Q class idx: 表示 类 的 类 型 ， 即 该 方法 所 属 的 类 。 

Q proto idx: 表示 此 方法 原型 。 

口 name idx: 表示 此 方法 名 字 。 

从 文件 的 0xf0 得 到 method id 列表 如 下 ， 共 有 4 个 method id item. 

Q 00000001 000b 0000 类 : Ljava/io/PrintStream:;， 原 型 为 VL， 名 字 为 println。 


< 
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口 
口 
口 


6.2.7 


由 第 7 行 的 “0110 0000” 得 出 class definitions 列表 的 位 置 为 0x110, 第 7 行 的 “0001 0000” 
处 class definitions 列表 中 class def item 的 数量 为 0x1。class definitions 的 结构 为 class def item, 
如 表 6-15 所 示 。 


0001 0000 0000 0000 类 : Ljava/lang/Object:， 原 型 为 V， 名 字 为 <init>。 
0004 0000 0000 0000 类 : Ljava/lang/System;， 原 型 为 V， 名 字 为 <init>。 
0004 0002 0009 0000 类 : Ljava/lang/System;, J" VL, 4% FX main. 


class_def_item 


3& 6-15 class def item 


class idx 


access flags 


superclass idx 
interfaces off 
source file idx 
annotations off. 
class data off 


static values off 


DOOOOOOO 


class idx: 表示 类 的 类 型 为 Ltest;。 
access_flags: 表示 访问 权限 。 

superclass idx: 表示 父 类 Ljava/lang/Object:;。 
interfaces off: 表示 没有 接口 。 

source file idx: 表示 文件 名 testjava。 
annotations off: 表示 没有 注释 。 

class data off: 表示 指向 class data item. 
static values off: 表示 暂时 无 。 


class data item 如 表 6-16 所 示 。 


表 6-16 class data item 


名 F 格 式 
static fields size uleb128 
instance fields size uleb128 
direct methods size uleb128 
virtual methods size uleb128 
static_fields encoded field[static fields size] 
instance fields encoded field[instance fields size] 
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BR 
名 F 格 式 
direct methods encoded method[direct methods size] 
virtual methods encoded method[virtual methods size] 


文件 的 0x227 Ab class data item 结构 。 从 0x227 处 得 来 的 字 节 序 如 下 。 


00 00 02 00 02 80 80 04 b0 02 01 09 c8 02 00 00 00 


口 static fields size 为 0。 

口 instance fields size 为 0。 

口 direct methods size 为 2。 

Q virtual methods size 为 0。 

因为 前 两 个 为 0, 所 以 下 一 个 字 节 开始 就 是 direct methods, encoded method 和 encoded field 
结构 如 下 ， 两 个 direct method 的 具体 说 明 如 下 。 

(1) 02 80 80 04 b0 02 

method idx diff: 为 0x2 <init>。 

access flags: 为 0x10000 (80 80 04)， 代 表 constructor method. 

code off: 7j 0x130 (b0 02) ， 指 向 code item. 

从 0x130 解析 code item: 


registers size 0x1 
ins_size 0x1 
outs_size 0x1 
tries_size 0 
debug_info_off 0x21b 
insns_size 0x4 


insns ushort [insns_size] 1070 0001 0000 000e 


(D 0x70 的 opcode 为 invoke-direct。 
其 格式 如 下 。 


invoke-direct (vD, vE, vF, vG, vA), meth@Cccc 
B: argument word count (4 bits) 

C: method index (16 bits) 

D..G, A: argument registers (4 bits each) 


分 布 如 下 。 


B|A|op CCCC G|F|E|D [B=5] op {vD, vE, vF, vG, vA}, methacccc 
[B-5] op (vD, vE, vF, vG, vA), type@Cccc 

[B-4] op (vD, vE, vF, vG), kindecccc 

[B-3] op (vD, vE, vF}, kindecccc 

[B-2] op {vD, vE}, kindecccc 

[B-1] op {vD}, kindecccc 

[B-0] op {}, kindecccc 


由 于 B=1, D=0, CCCC=0x0001, 对 应 的 method 为 Ljava/lang/Object; 的 <init>, 即 构造 方法 。 


«Q 


m 


"WP 深入 理解 Android 虚拟 机 - 


(2) 0x0e 的 opcode 为 return-void. 
经 过 上 述 分 析 ， 得 到 指令 如 下 。 


|0000: invoke-direct {v0}, Ljava/lang/Object;.«init»:()V // method@0001 
|0003: return-void 


(2) 0109c802 


method idx diffz 为 0x1，<init>。 
access flags: 为 0x9 (0x8 and 0x1), fV static and public. 
code off: 为 0x148 (c8 02)， 指 向 code item. 


从 0x148 解析 code item: 


registers size 0x3 
ins_size 0x1 
outs_size 0x2 
tries_size 0 
debug info off 0x220 
insns size 0x8 


insns ushort [insns_size] 0062 0000 011a 000c 206e 0000 0010 000e 


(D 0x62 的 opcode 为 sget-object， 其 格式 为 如 下 。 


sget-object vAA, field@BBBB 
A: value register or pair; may be source or dest (8 bits) 
B: static field reference index (16 bits) 


分 布 为 如 下 。 
AA|op BBBB 


由 于 AA=0，BBBB=0x0000， 字 段 为 out。 
®© Oxla 的 opcode 为 const-string， 其 格式 如 下 。 


const-string vAA, string@BBBB 
A: destination register (8 bits) 
B: string index 


分 布 如 下 。 
AA|op BBBB 


由 于 AA=1，BBBB=0x000c， 对 应 的 字符 串 为 testl。 
(G) 0x6e 的 opcode 为 : invoke-virtual， 其 格式 和 分 布 同 mvoke-direct。 


B|A|op cccc G|F|E|D [B-5] op (vD, vE, vF, vG, vA), meth@cccc 
[B-5] op {vD, vE, vF, vG, vA), type@Cccc 

[B-4] op (vD, vE, vF, vG), kindecccc 

[B-3] op (vD, vE, vF}, kindecccc 

[B-2] op (vD, vE), kindecccc 

[B-1] op (vD), kindecccc 

[B-0] op {}, kindecccc 


这 里 B-2, A=0, E=1, D=0, CCCC=0x0000, JjiA7j "Ljava/io/PrintStream;" {i println. 


第 6 章 dex 的 优化 和 安全 管理 


(à) Ox0e 的 opcode 为 retum-void。 经 过 上 述 分析 ， 得 到 指令 如 下 。 


sget-object v0, Ljava/lang/System;.out:Ljava/io/PrintStream; // field@0000 
const-string v1, "test!" // string@000c 

invoke-virtual {vo, vi},  Ljava/io/PrintStream;.println:(Ljava/lang/String;)V  // 
method@0000 

return-void 


encoded method 的 结构 如 表 6-17 所 示 。 


表 6-17 encoded method 


名 F 
method idx diff 


uleb128 


access flags uleb128 


code off 


uleb128 
encoded field 的 结构 如 表 6-18 所 示 。 


表 6-18 encoded field 


名 字 格 式 
field idx diff uleb128 
access_flags uleb128 
code item 的 结构 如 表 6-19 所 示 。 

表 6-19 code item 

名 F 格 式 
registers size ushort 
ins size ushort 
outs size ushort 
tries size ushort 
debug info off uint 
insns size uint 
insns ushort[insns size] 
padding ushort (optional) = 0 
tries try item[tries size] (optional). 
handlers encoded catch handler list (optional). 


6.3 dex 文件 结构 
在 Android 系统 中 ，dex 文件 是 可 以 直接 在 Dalvik 虚拟 机 中 加 载运 行 的 文件 。 通 过 ADT, 
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经 过 复杂 的 编译 ， 可 以 把 Java 源 代 码 转换 为 dex 文件 。 那 么 这 个 文件 的 格式 是 什么 样 的 呢 ? 为 
什么 Android 不 直接 使 用 class 文件 ， 而 采用 这 个 不 一 样 文件 呢 ? 其 实 它 是 针对 嵌入 式 系统 优化 
的 结果 ，Dalvik 虚拟 机 的 指令 码 并 不 是 标准 的 Java 虚拟 机 指令 码 ， 而 是 使 用 了 自己 独 有 的 一 套 
指令 集 。 如 果 有 自己 的 编译 系统 ， 可 以 不 生成 class 文件 ， 直接 生成 dex 文件 。dex 文件 中 共用 
了 很 多 类 名 称 、 常 量 字符 串 ， 使 它 的 体积 比较 小 ， 运 行 效率 也 比较 高 。 但 归根 到 底 ，Dalvik 虚 
拟 机 还 是 基于 寄存 器 的 虚拟 机 的 一 个 实现 。 


6.3.1 文件 头 (File Header) 


dex 文件 头 主要 包括 校 验 和 以 及 其 他 结构 的 偏 移 地 址 和 长 度 信息 ， 文 件 头 的 结构 如 表 6-20 
所 示 。 


表 6-20 文件 头 的 结构 


字段 名 称 偏 移 值 | 长 度 描述 
"Magic' 值 ， 即 魔 数字 段 ， 格 式 如 "dex/n035/0"， 其 中 的 035 表示 
magic 0x0 8 结构 的 版 本 
checksum Ox8 el 校 验 码 
signature OxC 20 SHA-1 签名 
file size 0x20 区 到 dex 文件 的 总 长 度 
header size 0x24 Em 文件 头 长 度 ，009 版 本 =0x5C.035 版 本 =0x70 
NM n a 标识 字 节 顺序 的 常量 ,根据 这 个 常量 可 以 判断 文件 是 否 交换 了 字 
= 节 顺 序 . 缺 省 情况 下 =0x78563412 
link size 0x2C | 4 连接 段 的 大 小 ， 如 果 为 0 就 表示 是 静态 连接 
. 连接 段 的 开始 位 置 ， 从 本 文件 头 开始 算 起 。 如 果 连 接 段 的 大 小 为 
link off 0x30 |4 . 
= 0， 这 里 也 是 0 
map off 0x34 ra map 数据 基地 址 
string ids size | 0x38 | 4 | 字符 串 列表 的 字符 串 个 数 
string ids off Ox3C 4 字符 串 列表 表 基 地 址 
ype ids size 0x40 4 类 型 列表 里 类 型 个 数 
ype ids off 0x44 4 类 型 列表 基地 址 
proto ids size | oxas | 4 | 原型 列表 里 原型 个 数 
proto ids off | 0x4C | 4 | 原型 列表 基地 址 
field ids size Ox50 4 字段 列表 里 字段 个 数 
field ids off 0x54 4 字段 列表 基地 址 
method ids size | 0x58 4 方法 列表 里 方法 个 数 
method ids off Ox5C 4 方法 列表 基地 址 
class defs size 0x60 4 类 定义 类 表 中 类 的 个 数 
class defs off 0x64 类 定义 列表 基地 址 
data size 0x68 数据 段 的 大 小 ， 必 须 以 4 字 节 对 齐 
data off Ox6C 数据 段 基地 址 
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6.32 RAFF 


魔 数 字段 主要 就 是 Dex 文件 的 标识 符 ， 占 用 4 个 字 节 ， 在 目前 的 源码 里 是 “dexm”， 它 
的 作用 主要 是 用 来 标识 dex 文件 的 ， 比 如 有 一 个 文件 也 以 dex 为 后 级 名 ， 仅 此 并 不 会 被 认为 是 
Davlik 虚拟 机 运行 的 文件 ， 还 要 判断 这 4 个 字 节 。 另 外 Davlik 虚拟 机 也 有 优化 的 dex， 也 是 通 
过 个 字段 来 区 分 的 ， 当 它 是 优化 的 dex 文件 时 ， 它 的 值 就 变 成 “deym” 了 。 根 据 这 4 个 字 节 ， 
就 可 以 识别 不 同类 型 的 dex 文件 了 。 

紧 跟 在 “dexm” 后 面 的 是 版 本 字段 ， 主 要 用 来 标识 dex 文件 的 版 本 。 目 前 支持 的 版 本 号 为 
“035\0”， 无 论 是 否 优化 的 版 本 ， 都 是 使 用 这 个 版 本 号 。 


6.3.3 ”检验 码 字段 


检验 码 字段 主要 用 来 检查 从 这 个 字段 开始 到 文件 结尾 ， 这 段 数据 是 否 完整 ， 有 没有 人 修改 
过 ， 或 者 在 传送 过 程 中 是 否 有 出 错 等 。 通 常用 来 检查 数据 是 否 完整 的 算法 ，CRC32、SHA128 
等 ， 但 这 里 采用 并 不 是 这 两 类 ， 而 采用 一 个 比较 特别 的 算法 ， 叫 作 adler32， 这 是 在 开源 zlib 里 
常用 的 算法 ， 用 来 检查 文件 是 否 完整 性 。 该 算法 是 由 MarkAdler 发 明 的 ， 其 可 靠 程度 跟 CRC32 
差不多 , 不 过 还 是 弱 一 点 点 ,但 它 有 一 个 很 好 的 优点 , 就 是 使 用 软件 来 计算 检验 码 时 比较 CRC32 
要 快 很 多 。 可 见 Android 系统 ， 就 算法 上 就 已 经 为 移动 设备 进行 优化 了 。 

下 面 是 Adler32 算法 的 C 源码 ， 注 意 在 Java 中 可 使 用 java.util.zip.Adler32 类 做 校 验 操作 。 

#define ZLIB INTERNAL 

#include "zlib.h" 

#define BASE 65521UL /* largest prime smaller than 65536 */ 


#define NMAX 5552 
/*NMAX is the largest n such that 255n(n+1)/2 + (n+1) (BASE-1) «-2^32-1 */ 


#define DO1(buf,i) {adler += (buf) [i]; sum2 += adler;} 
#define DO2(buf,i) DO1(buf,i); DOl(buf,i«1); 

#define DO4(buf,i) DO2(buf,i); DO2(buf,i+2); 

#define DO8 (buf,i) DO4(buf,i); DO4 (buf, i+4); 

#define DO16 (buf) DO8 (buf,0); DO8 (buf, 8) ; 


/*use NO_DIVIDE if your processor does not do division in hardware */ 
#ifdef NO_DIVIDE 

#define MOD(a) \ 

do{ V 


if(a >= (BASE << 16)) a -= (BASE << 16); \ 
if(a >= (BASE << 15)) a -= (BASE << 15); \ 
if(a >= (BASE << 14)) a -= (BASE << 14); \ 
if(a >= (BASE << 13)) a -= (BASE << 13); \ 
if(a >= (BASE << 12)) a -= (BASE << 12); \ 
if(a >= (BASE << 11)) a -= (BASE << 11); V 
if(a (BASE << 10)) a -= (BASE << 10); \ 
if(a >= (BASE << 9)) a -= (BASE << 9); \ 


if(a >= (BASE << 7)) a -= (BASE << 7); \ 


if(a >= (BASE << 8)) a -= (BASE << 8); \ 
if(a >= (BASE << 6)) a -= (BASE << 6); \ 


«Q 


深入 理解 Android 虚拟 机 


if(a »- (BASE << 5)) a -= (BASE << 5); V 
if(a »- (BASE «« 4)) a -- (BASE «« 4); V 
if(a »- (BASE «« 3)) a -- (BASE «« 3); V 
if(a »- (BASE «« 2)) a -- (BASE «« 2); V 
if(a »- (BASE «« 1)) a -- (BASE «« 1); V 
if(a >= BASE) a -= BASE; \ 

)while (0) 

$4 define MOD4(a) V 

aof V 

if(a »- (BASE «« 4)) a SN 
if(a »- (BASE «« 3)) a ON 
if(a >= (BASE << 2)) a iN 
if(a >= (BASE << 1)) a ER 


if(a »- BASE) a -- BASE; V 
}while (0) 

#else 

#define MOD(a) a $- BASE 
#define MOD4(a) a $- BASE 
#endif 


[t= 


uLong ZEXPORT adler32(adler, buf, len) 


uLong adler; 
const Bytef *buf; 
uInt len; 


unsigned long sum2; 
unsigned n; 


/*split Adler-32 into component sums */ 
sum2= (adler >> 16) & Oxffff; 
adler&- Oxffff; 


/*in case user likes doing a byte at a time, keep it fast */ 
if(len == 1) ( 

adler+= buf [0]; 

if (adler >= BASE) adler-= BASE; 

sum2+= adler; 

if (sum2 >= BASE) sum2-= BASE; 

return adler|(sum2 << 16); 


} 


/*initial Adler-32 value (deferred check for len == 1 speed) */ 
if (buf == Z NULL)return 1L; 


/*in case short lengths are provided, keep it somewhat fast */ 
if(len < 16) { 
while(len--) { 
adler+= *buf++; 
sum2+= adler; 
} 
if (adler >= BASE) 
adler-= BASE; 
MOD4 (sum2); /* only added so many BASE's */ 
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return adler| (sum2 << 16); 


} 


/*do length NMAX blocks -- requires just one modulo operation */ 
while(len >= NMAX) { 
len-= NMAX; 
n= NMAX/16; /* NMAX is divisible by 16 */ 
do( 
DOl6(buf); /* 16 sums unrolled */ 
buf+= 16; 
}while (--n); 
MOD (adler); 
MOD (sum2) ; 


) 


/*do remaining bytes (less than NMAX, still just one modulo) */ 
if(len) ( 
/* avoid modulos if none remaining */ 
while(len »- 16) { 
len-- 16; 
DO16 (buf) ; 
buf+= 16; 
} 
while(len--) { 
adler+= *buf++; 
sum2+= adler; 


MOD (adler) ; 
MOD (sum2) ; 


} 
/*return recombined sums */ 
return adler|(sum2 << 16); 


} 
6.34 SHA-1 签名 字段 


在 dex 文件 里 ， 前 面 已 经 有 了 面 有 一 个 4 字 节 的 检验 字段 码 了 ， 为 什么 还 有 SHA-1 签名 字 
段 呢 ? 这 样 不 是 造成 重复 了 吗 ? 这 是 因为 dex 文件 一 般 都 不 是 很 小 ， 简 单 的 应 用 程序 都 有 几 十 
KB， 这 么 多 数据 使 用 一 个 4 字 节 的 检验 码 ， 重 复 的 概率 还 是 有 的 ， 也 就 是 说 当 文 件 里 的 数据 修 
改 了 ， 还 是 很 有 可 能 检验 不 出 来 的 。 这 样 检验 码 就 失去 了 作用 ， 需 要 使 用 更 加 强大 的 检验 码 ， 
这 就 是 SHA-1. SHA-1 校 验 码 有 20 个 字 节 ， 比 前 面 的 检验 码 多 了 16 个 字 节 ， 几 乎 不 会 不 同 的 
文件 计算 出 来 的 检验 是 一 样 的 。 设 计 两 个 检验 码 的 目的 ， 就 是 先 使 用 第 一 个 检验 码 进行 快速 检 
查 ， 这 样 可 以 先 把 简单 出 错 的 dex 文件 丢掉 了 ， 接 着 再 使 用 第 二 个 复杂 的 检验 码 进行 复杂 计算 ， 
验证 文件 是 否 完整 ， 这 样 确保 执行 的 文件 完整 和 安全 。 

SHA 是 Secure Hash Algorithm 的 缩写 ， 意 为 安全 散 列 算法 ， 是 由 美国 国家 安全 局 设计 ， 美 
国 国家 标准 与 技术 研究 院 发 布 的 一 系列 密码 散 列 函 数 。 SHA-1 看 起 来 和 MDS 算法 很 像 ， 也 许 是 
Ron Rivest 在 SHA-1 的 设计 中 起 了 一 定 的 作用 。SHA-1 的 内 部 比 MDS 更 强 ， 其 摘要 比 MDS 的 
16 字 节 长 4 个 字 节 ， 这 个 算法 成 功 经 受 了 密码 分 析 专 家 的 攻击 ， 也 因而 受到 密码 学 界 的 广泛 推 
崇 。 这 个 算法 在 BT 软件 里 就 有 大 量 使 用 ， 比 如 在 BT 里 要 计算 是 否 同一 个 种 子 时 ,就 是 利用 文 
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件 的 签名 来 判断 的 。 同 一 份 8G 的 电影 从 几 千 个 BT 用 户 那里 下 载 ， 也 不 会 出 现 错误 的 数据 ， 导 


致 不 能 播放 电影 。 


6.3.5 map_off 字段 


这 个 字段 主要 保存 map 开始 位 置 ， 就 是 从 文件 头 开始 到 map 数据 的 长 度 ， 通 过 这 个 索引 就 


可 以 找到 map 数据 。map 的 数据 结构 如 表 6-21 所 示 。 


表 6-21 map 的 数据 结构 


map 里 项 的 个 数 


每 一 项 定义 为 12 字 节 ， 项 的 个 数 由 上 面 项 大 小 决定 


定义 map 数据 排列 结构 的 格式 如 下 。 
/* 


*Direct-mapped "map list". 
vill 
truct DexMapList { 
u4 size; /* #of entries inlist */ 
DexMapItem list[1]; /* entries */ 
}DexMapList ; 


每 一 个 map 项 的 结构 定义 格式 如 下 。 


/* 
*Direct-mapped "map item". 
Ji 
typedef struct DexMapItem ( 
u2 type; /* type code (seekDexType* above) */ 
u2 unused; 
u4 size; /* count of items ofthe indicated type */ 
u4 offset; /* file offset tothe start of data */ 
}DexMapItem; 


结构 DexMapltem 的 功能 是 定义 每 一 项 的 数据 意义 ， 例 如 类 型 、 类 型 个 数 、 类 型 开始 位 置 。 


其 中 定义 类 型 的 代码 如 下 。 


/*map item type codes */ 

enum( 
kDexTypeHeaderItem = 0x0000, 
kDexTypeStringIdItem = 0x0001, 
kDexTypeTypeIdItem - 0x0002, 
kDexTypeProtoIdItem - 0x0003, 
kDexTypeFieldIdItem - 0x0004, 
kDexTypeMethodIdItem - 0x0005, 
kDexTypeClassDefItem = 0x0006, 
kDexTypeMapList - 0x1000, 
kDexTypeTypeList - 0x1001, 
kDexTypeAnnotationSetRefList = 0x1002, 
kDexTypeAnnotationSetItem = 0x1003, 
kDexTypeClassDataltem = 0x2000, 
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kDexTypeCodeItem = 0x2001, 
kDexTypeStringDataltem = 0x2002, 
kDexTypeDebugInfoltem - 0x2003, 
kDexTypeAnnotationItem = 0x2004, 
kDexTypeEncodedArrayItem = 0x2005, 
kDexTypeAnnotationsDirectoryItem = 0x2006, 
h 
从 上 面 的 类 型 可 知 ， 它 包括 了 在 dex 文件 里 可 能 出 现 的 所 有 类 型 。 可 以 看 出 这 里 的 类 型 其 
实 就 是 文件 头 里 定义 的 类 型 。 此 map 数据 就 是 头 中 类 型 的 重复 , 完全 是 为 了 检验 作用 而 存在 的 。 
当 Android 系统 加 载 dex 文件 时 ， 如 果 文 件 头 里 定义 的 类 型 个 数 与 map 里 不 一 致 时 ， 就 会 停止 
使 用 这 个 dex 文件 。 


6.3.6 string ids size 和 off 字段 


这 两 个 字段 主要 用 来 标识 字符 串 资源 。 在 编译 源 程序 后 ， 程 序 里 用 到 的 字符 串 都 保存 在 这 
个 数据 段 里 ， 以 便 解 释 执 行 这 个 dex 文件 。 其 中 包括 调用 库 函 数 里 的 类 名 称 描述 ， 用 于 输出 显 
示 的 字符 串 等 。 

string ids size 标识 了 有 多 少 个 字符 串 ，string ids off 标识 字符 串 数 据 区 的 开始 位 置 。 字 符 
串 的 存储 结构 如 下 。 

A Direct-mapped "string id item". 

CENE struct DexStringld { 

u4 stringDataOff; /* file offset to string data item */ 

} DexStringlId; 

由 此 可 以 看 出 ， 这 个 数据 区 保存 的 只 是 字符 串 表 的 地 址 索引 。 如 果 要 找到 字符 串 的 实际 数 
据 ， 还 需要 通过 这 个 地 址 索引 找到 文件 的 相应 开始 位 置 ， 然 后 才能 得 到 字符 串 数 据 。 每 一 个 字 
符 串 项 的 索引 占用 4 个 字 节 ， 因 此 这 个 数据 区 的 大 小 就 为 4*string ids_size。 实 际 数据 区 中 的 字 
符 串 采用 UTES 格式 保存 。 

例如 ， 如 果 dex 文件 使 用 16 进 制 显示 出 来 内 容 如 下 。 


063c 696e 6974 3e00 


其 实际 数据 则 是 “<init>\0”。 

另外 这 段 数据 中 不 仅 包 括 字符 串 的 内 容 和 结束 标志 ， 在 最 开头 的 位 置 还 标明 了 字符 串 的 长 
度 。 上 例 中 第 一 个 字 节 06 就 表示 这 个 字符 串 有 6 个 字符 。 

关于 字符 串 的 长 度 ， 有 如 下 两 点 需要 注意 的 地 方 。 

(1) 关于 长 度 的 编码 格式 

dex 文件 里 采用 变 长 方式 表示 字符 串 的 长 度 。 一 个 字符 串 的 长 度 可 能 是 一 个 字 节 ( 小 于 256) 
或 者 4 个 字 节 (1GB 大 小 以 上 )。 字 符 串 的 长 度 大 多 数 都 是 小 于 256 个 字 节 , 因此 需要 使 用 一 种 编 
码 方式 ， 既 可 以 表示 一 个 字 节 的 长 度 ， 也 可 以 表示 4 个 字 节 的 长 度 ， 并 且 1 个 字 节 的 长 度 占 绝 
大 多 数 。 能 满足 这 种 表示 的 编码 方式 有 很 多 ， 但 dex 文件 里 采用 的 是 leb128 方式 。leb128 编码 
是 一 种 变 长 编码 ， 每 个 字 节 采用 7 位 来 表达 原来 的 数据 ， 最 高 位 用 来 表示 是 否 有 后 继 字 节 。 它 
的 编码 算法 如 下 : 

«Q 
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/* 


* Writes a 32-bit value in 


unsigned ULEB128 format. 


* Returns the updated pointer. 


DEX INLINE ul* writeUnsignedLeb128 (ul* ptr, u4 data) 


*/ 
{ 
while (true) { 
ul out = data & Ox7f; 
if (out != data) { 
*ptr++ = out | 0x80; 
data >>= 7; 
} else { 
*ptr++ = out; 
break; 
} 
} 
return ptr; 
} 
它 的 解码 算法 如 下 。 
/* 


* Reads an unsigned LEB128 
* just past the end of the 
* non-zero high-order bits 


cil 


value, updating the given pointer to point 
read value. This function tolerates 
in the fifth encoded byte. 


DEX INLINE int readUnsignedLeb128 (const ul** pStream) { 
const ul* ptr = *pStream; 


int result = *(ptr++); 
if (result > Ox7f) { 
int cur = *(ptr++); 


result = (result & Ox7f) | ((cur & 0x7f) << 7); 


if (cur > Ox7f) { 
cur = *(ptr++); 


result |= (cur & Ox7f) << 14; 


if (cur > Ox7f) { 


cur = *(ptr++); 


result |= (cur 


& Ox7f) << 21; 


if (cur > Ox7f) { 


/* 
* Note: We 


don't check to see if cur is out of 


* range here, meaning we tolerate garbage in the 
* high four-order bits. 


en 


cur = *(ptr++); 
result |- cur «« 28; 


} 
} 
*pStream = ptr; 


return result; 


} 


根据 上 面 的 算法 分 析 上 面 例子 中 的 字符 串 ， 取 得 第 一 个 字 节 是 06， 最 高 位 为 0， 


因此 没有 
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后 继 字 节 , 那么 取出 这 个 字 节 里 7 位 有 效 数 据 , 就 是 6, 也 就 是 说 这 个 字符 串 的 长 度 是 6 个 字 节 ， 
但 不 包括 结束 字符 “\0”。 

(2) 长 度 的 意义 

由 于 字符 串 内 容 采 用 的 是 UTF-8 格式 编码 ， 这 表示 一 个 字符 的 字 节 数 是 不 定 的 。 即 有 时 是 
一 个 字 节 表 示 一 个 字符 ， 有 时 是 两 个 、 三 个 甚至 四 个 字 节 表示 一 个 字符 。 而 这 里 的 长 度 代表 的 
并 不 是 整个 字符 串 所 占用 的 字 节 数 ， 只 是 表示 这 个 字符 串 包 含 的 字符 个 数 。 所 以 在 读 取 时 需要 
注意 ， 尤 其 是 在 包含 中 文字 符 时 ， 往 往 会 因为 读 取 的 长 度 不 正确 导致 字符 串 被 截断 。 


6.4 Android 的 DexFile 接口 


DexFile 接口 的 继承 关系 如 下 。 

D public final class DexFile extends Object 

Q java.lang.Object 

D dalvik.system.DexFile 

操作 dex 文件 的 原理 上 和 操作 ZipFile 相似 ， 主 要 是 在 类 装载 器 中 被 使 用 。 在 实际 应 用 中 ， 
我 们 不 直接 打开 和 读 取 dex 文件 ， 它 们 被 虚拟 机 以 只 读 方 式 映射 到 内 存 中 。 


6.4.1 构造 函数 


(1) public DexFile (File file) 

此 函数 的 功能 是 通过 指定 的 File 对 象 打开 dex 文件 ， 指 定 的 文件 通常 是 zip BY jar 格式 的 压 
缩 文 件 ， 在 里 面包 含 一 个 名 为 “classes.dex” 的 文件 。 虚 拟 机 将 在 目录 /data/dalvik-cache 下 生成 
对 应 的 文件 名 字 并 打开 它 ， 如 果 系 统 权 限 允 许 的 话 会 首先 创建 或 更 新 它 。 不 要 把 目录 
/data/dalvik-cache 下 的 文件 名 给 它 ， 因 为 这 个 文件 被 认为 处 于 初始 状态 (dex 被 优化 之 前 )。 
此 构造 函数 的 参数 是 File， 表 示 引 用 实际 dex 文件 的 File 对 象 。 此 函数 会 发 生 VO 异常 , Bil 
如 文件 不 存在 或 者 没有 权限 访问 。 
(2) public DexFile (String fileName) 
此 函数 的 功能 是 打开 指定 文件 名 的 dex 文件 。 此 处 指定 的 文件 通常 是 zip BR jar 格式 的 压缩 
文件 ， 里 面包 含 一 个 “classes.dex”。 虚 拟 机 将 在 目录 /data/dalvik-cache 下 生成 对 应 的 文件 名 字 
并 打开 它 ， 如 果 系 统 权 限 允 许 的 话 会 首先 创建 或 更 新 它 。 不 要 把 目录 /data/dalvik-cache 下 的 文件 
名 给 它 ， 因 为 这 个 文件 被 认为 处 于 初始 状态 (dex 被 优化 之 前 )。 
此 构造 函数 的 参数 是 fleName， 表 示 dex 文件 名 。 此 函数 会 发 生 IO 异常 , 例如 文件 不 存在 
或 者 没有 权限 访问 。 


6.42 ”公共 方法 


(1) public void close () 
此 公共 方法 的 功能 是 关闭 dex 文件 。 有 可 能 无 法 释放 任何 资源 。 如 果 来 自 dex 文件 的 类 还 
存活 着 的 话 ，dex 文件 不 能 被 取消 映射 。 此 方法 可 能 会 在 关闭 文件 的 过 程 中 可 能 发 生 IO 异常 ， 
但 是 一 般 不 会 发 生 。 
«Q 
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(2) public Enumeration entries () 

此 公共 方法 的 功能 是 枚 举 dex 文件 里 面 的 类 名 。 返 回 值 是 dex 文件 所 包含 类 名 的 枚 举 ， 类 
类 型 是 一 般 内 部 格式 ( 像 java/lang/String)。 

(3) public String getName 0 

此 公共 方法 的 功能 是 获取 (已 打开 的 )dex 文件 名 ， 返 回 值 是 文件 名 。 

(4) public static boolean isDexOptNeeded (String fileName) 

此 公共 方法 的 功能 是 ， 如 果 虚 拟 机 认为 apk/jar 文件 已 经 过 期 返回 tue， 并 且 应 该 再 次 通过 


“dexopt” 传 递 。 参 数 fileName 表示 被 检查 apk/jar 文件 的 绝对 路 径 名 。 如 果 应 该 调用 dexopt 处 
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装载 
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优化 
该 方 
调用 


件 返 回 true; 否则 false。 

此 公共 方法 会 发 生 如 下 异常 。 

U FileNotFoundException: 文件 不 可 读 、 不 是 一 个 文件 或 者 文件 不 存在 。 

Q IOException: fileName 不 是 有 效 的 apk/jar 文件 ， 或 者 在 解析 文件 时 出 现 问题 。 

Q NullPointerException: fileName 是 空 的 。 

O StaleDexCacheEror: 优化 过 的 dex 文件 已 过 期 且 位 于 只 读 分 区 。 

(5) public Class loadClass (String name, ClassLoader loader) 

此 公共 方法 的 功能 是 装载 一 个 类 ， 会 返回 成 功 装载 的 类 ， 如 果 失 败 则 返回 空 值 。 如 果 在 类 

器 之 外 调用 它 ， 往 往 不 会 得 到 想 要 的 结果 ， 这 时 可 使 用 forName(String)。 

该 方法 不 会 在 找 不 到 类 的 时 候 抛 出 ClassNotFoundException 异常 ， 因 为 每 次 在 我 们 看 到 的 

个 dex 文件 里 找 不 到 类 就 粗暴 地 抛 出 异常 是 不 合理 的 。 

此 公共 方法 的 参数 如 下 。 

O name: 类 名 ， 应 该 是 一 个 “java/lang/String”。 

口 loader: 试图 装载 类 的 类 装载 器 ， 大 多 数 情况 下 就 是 该 方法 的 调用 者 。 

此 公共 方法 的 返回 值 是 类 名 对 应 的 对 象 ， 当 装载 失败 时 返回 空 。 

(6) public static DexFile loadDex (String sourcePathName, String outputPathName, int flags) 

此 公共 方法 的 功能 是 打开 一 个 dex 文件 ， 并 提供 一 个 文件 来 保存 优化 过 的 dex 数据 。 如 果 

过 的 格式 已 存在 并 且 是 最 新 的 ， 就 直接 使 用 它 。 如 果 不 是 ， 虚 拟 机 将 试图 重新 创建 一 个 。 

法 主要 用 于 应 用 希望 在 通常 的 应 用 安装 机 制 之 外 下 载 和 执行 dex 文件 。 不 能 在 应 用 里 直接 

该 方法 ， 而 应 该 通过 一 个 类 装载 器 例如 dalvik.system.DexClassLoader。 

此 公共 方法 的 参数 如 下 。 

O sourcePathName: 包含 “classes.dex” 的 Jar 或 者 APK 文件 (将 来 可 能 会 扩展 支持 “raw 
DEX”)。 

O outputPathName: 保存 优化 过 的 DEX 数据 的 文件 。 

口 flags: 打开 可 选 功能 。 

返回 值 是 一 个 新 的 或 者 先前 已 经 打开 的 DexFile。 

此 公共 方法 可 能 发 生 IOException 异常 ， 表 示 无 法 打开 输入 或 输出 文件 。 


注意 


@> 


: 在 DexFile 接口 中 还 有 一 个 受 保护 的 方法 protected void finalize()， 此 方法 的 功能 是 在 类 
结束 时 调用 ， 确 保 DEX 文件 被 关闭 。 另 外 ， 此 受 保 护 的 方法 在 关闭 文件 时 可 能 发 生 VO 
异常 。 
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6.5 Dex 和 动态 加 载 类 机 制 


在 Android 应 用 开发 的 一 般 情 况 下 ， 常 规 的 开发 方式 和 代码 架构 就 能 满足 普通 的 需求 。 但 
是 有 些 特殊 问题 ， 常常 引 发 进一步 的 思考 。 例 如 应 该 怎么 样 开发 一 个 可 以 自 定义 控件 的 Android 
应 用 ? 就 像 Eclipse 一 样 ， 可 以 动态 加 载 插件 。 如 何 让 Android 应 用 执行 服务 器 上 的 不 可 预知 的 
代码 ? 如 何 对 Android 应 用 加 密 ， 而 只 在 执行 时 自 解密 ， 从 而 防止 被 破解 ?》 上述 问 题 ， 我 们 可 
以 使 用 类 加 载 器 来 灵活 的 加 载 执行 的 类 。 


6.5.1 类 加 载 机 制 


Dalvik 虚拟 机 如 同 其 他 Java 虚拟 机 一 样 , 在 运行 程序 时 首先 需要 将 对 应 的 类 加 载 到 内 存 中 。 
而 在 标准 的 Java 虚拟 机 中 ， 类 加 载 可 以 从 class 文件 中 读 取 , 也 可 以 是 其 他 形式 的 二 进 制 流 。 因 
此 ， 我 们 常常 利用 这 一 点 ， 在 程序 运行 时 手动 加 载 Class， 从 而 达到 代码 动态 加 载 执行 的 目的 。 

然而 Dalvik 虚拟 机 毕竟 不 算是 标准 的 Java 虚拟 机 ， 因 此 在 类 加 载 机 制 上 ， 它 们 有 相同 的 地 
方 ， 也 有 不 同 的 地 方 。 我 们 必须 区 别 对 待 。 

例如 当 在 使 用 标准 Java 虚拟 机 时 , 我 们 经 常 自 定义 继承 自 ClassLoader 的 类 加 载 器 。 然 后 通 
过 defineClass 方法 来 从 一 个 二 进 制 流 中 加 载 Class。 然 而 ， 这 在 Android 里 是 行 不 通 的 ， 大 
家 就 没 必要 走 弯路 了 。 参 看 源码 我 们 知道 ，Android 中 ClassLoader 的 defineClass 方法 具体 
是 调用 VMClassLoader 的 defineClass 本 地 静态 方法 。 而 这 个 本 地 方法 除了 抛 出 一 个 
“UnsupportedOperationException” 之 外 ， 什 么 都 没 做 ， 甚 至 连 返回 值 都 为 空 。 


static void Dalvik java lang VMClassLoader defineClass(const u4* args, 
JValue* pResult) 
{ 


Object* loader = (Object*) args[0]; 

StringObject* nameObj = (StringObject*) args[1]; 

const ul* data - (const ul*) args[2]; 

int offset - args[3]; 

int len = args[4]; 

Object* pd - (Object*) args[5]; 

char* name - NULL; 

name = dvmCreateCstrFromString (nameObj) ; 

LOGE("ERROR: defineClass(%p, $s, $p, %d, %d, $p) in", 
loader, name, data, offset, len, pd); 

dvmThrowException ("Ljava/lang/UnsupportedOperationException;", 
"can't load this type of class file"); 

free (name); 

RETURN VOID(); 


} 


6.5.2 Dalvik 虚拟 机 类 加 载 机 制 


那 如 果 在 Dalvik 虚拟 机 里 ，ClassLoader 不 好 使 ， 我 们 如 何 实现 动态 加 载 类 呢 ? Android 为 
我 们 从 ClassLoader 派生 出 了 两 个 类 : DexClassLoader 和 PathClassLoader。 其 中 需要 特别 说 明 的 
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是 PathClassLoader 中 一 段 被 注释 掉 的 代码 。 


/* --this doesn't work in current version of Dalvik-- 
if (data !- null) { 
System.out.println("--- Found class " « name 
+ "in zip[" + i+ "] '" + mZips[i].getName() + "'"); 
int dotIndex = name.lastIndexOf('.'); 
if (dotIndex != -1) { 
String packageName - name.substring(0, dotIndex); 
synchronized (this) { 
Package packageObj - getPackage (packageName) ; 
if (packageObj == null) { 
definePackage (packageName, null, null, 
null, null, null, null, null); 
} 


} 
} 


return defineClass(name, data, 0, data.length) ; 


} 
a 
这 从 另 一 方面 佐证 了 函数 defineClass()7E Dalvik 虚拟 机 里 确实 是 被 删除 了 。 而 在 这 两 个 继承 
自 ClassLoader 的 类 加 载 器 ， 本 质 上 是 重 载 了 ClassLoader 的 findClass 方法 。 在 执行 loadClass 
时 ， 我 们 可 以 参看 ClassLoader 部 分 源码 。 
protected Class«?» loadClass(String className, boolean resolve) 
throws ClassNotFoundException ( 
Class<?> clazz = findLoadedClass (className) ; 
if (clazz == null) { 
try { 
clazz = parent.loadClass(className, false) ; 
} catch (ClassNotFoundException e) { 
// Don't want to see this. 


} 
if (clazz == null) { 
clazz = findClass (className) ; 
} 
} 


return clazz; 

} 

因此 DexClassLoader 和 PathClassLoader 都 属于 符合 双亲 委派 模型 的 类 加 载 器 (因为 它们 没有 
重 载 loadClass 方法 )。 也 就 是 说 ,它们 在 加 载 一 个 类 之 前 , 会 回去 检查 自己 以 及 自己 以 上 的 类 加 
载 器 是 否 已 经 加 载 了 这 个 类 。 如 果 已 经 加 载 过 了 ， 就 会 直接 将 之 返回 ， 而 不 会 重复 加 载 。 

DexClassLoader 和 PathClassLoader 其 实 都 是 通过 DexFile 类 来 实现 类 加 载 的 。 这 里 需要 顺 
便 提 一 下 的 是 ，Dalvik 虚拟 机 识别 的 是 dex 文件 ， 而 不 是 class 文件 。 因 此 ， 供 类 加 载 的 文件 也 
只 能 是 dex 文件 ， 或 者 包含 有 dex 文件 的 .apk BK jar 文件。 

也 许 有 人 想到 , 既然 DexFile 可 以 直接 加 载 类 , 那么 为 什么 还 要 使 用 ClassLoader 的 子 类 呢 ? 
DexFile 在 加 载 类 时 ， 上 有 具体 是 调用 成 员 方法 loadClass 或 者 loadClassBinaryName 。 其 中 
loadClassBinaryName 需要 将 包含 包 名 的 类 名 中 的 “.” 转 换 为 “/”。 我 们 看 一 下 loadClass 代码 
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就 明白 了 。 


public Class loadClass(String name, ClassLoader loader) { 
String slashName = name.replace('.', '/'); 
return loadClassBinaryName(slashName, loader) ; 

} 

在 这 段 代码 前 有 一 段 注释 ， 截 取 关 键 一 部 分 就 是 说 : 如 果 认 为 这 不 是 一 个 类 装载 器 ， 这 是 
最 有 可 能 不 去 做 预期 想 要 的 ， 而 使 用 {@link Class#forName(String)} 则 正好 相反 。 这 就 是 我 们 需 
要 使 用 ClassLoader 子 类 的 原因 。 至 于 它 是 如 何 验证 是 否 是 在 ClassLoader 中 调用 此 方法 的 ， 我 
没有 研究 ， 大 家 如 果 有 兴趣 可 以 继续 深入 下 去 。 

有 一 个 细节 ， 可 能 大 家 不 容易 注意 到 。PathClassLoader 是 通过 构造 函数 new DexFile(path) 
来 产生 DexFile 对 象 的 ， 而 DexClassLoader 则 是 通过 其 静态 方法 loadDex(path，outpath，0) 得 到 
DexFile 对 象 的 。 这 两 者 的 区 别 在 于 DexClassLoader 需要 提供 一 个 可 写 的 outpath 路 径 ， 用 来 释 
放 .apk 包 或 者 .jar 包 中 的 dex 文件 。 换 个 说 法 来 说 ， 就 是 PathClassLoader 不 能 主动 从 zip PFE 
放出 dex, 因此 只 支持 直接 操作 dex 格式 文件 , 或 者 已 经 安装 的 apk( 因 为 已 经 安装 的 apk 在 cache 
中 存在 缓存 的 dex 文件 )。 而 DexClassLoader 可 以 支持 .apk、.jar 和 .dex 文件 ， 并 且 会 在 指定 的 
outpath 路 径 释放 出 dex 文件 。 

另外 ，PathClassLoader 在 加 载 类 时 调用 的 是 DexFile 的 loadClassBinaryName， 而 
DexClassLoader 调用 的 是 loadClass。 因 此, 在 使 用 PathClassLoader 时 类 全 名 需要 用 “/” 奉 换 “.”。 


6.5.3 ”具体 的 实际 操作 


接 下 来 将 要 讲解 的 具体 操作 比较 简单 ， 可 能 使 用 到 的 工具 有 javac、dx、eclipse 等 。 其 中 dx 
工具 最 好 指明 “--no-strict”， 因 为 class 文件 的 路 径 可 能 不 匹配 。 

在 加 载 类 之 后 ， 通 常 可 以 通过 Java 反射 机 制 来 使 用 这 个 类 。 但 是 这 样 效率 相对 不 高 ， 而 且 
经 常用 反射 代码 也 会 比较 复杂 凌乱 。 更 好 的 做 法 是 定义 一 个 interface, 并 将 这 个 interface 写 进 容 
器 端 。 待 加 载 的 类 ， 继 承 自 这 个 interface， 并 且 有 一 个 参数 为 空 的 构造 函数 ， 以 便 我 们 能 够 通过 
Class 的 newInstance 方法 来 产生 对 象 。 然 后 将 对 象 强制 转换 为 interface 对 象 ， 于 是 就 可 以 直接 
调用 成 员 方 法 了 。 


6.5.4 ”代码 加 密 


在 实现 代码 加 密 时 ， 最 初 的 设想 是 将 dex 文件 加 密 ， 然 后 通过 INI 将 解密 代码 写 在 Native 
层 。 解 密 之 后 直接 传 上 二 进 制 流 ， 再 通过 defineClass 将 类 加 载 到 内 存 中 。 

其 实现 在 也 可 以 这 样 做 ， 由 于 不 能 直接 使 用 defineClass， 而 必须 传 文件 路 径 给 Dalvik 虚拟 
机 内 核 ， 因 此 解密 后 的 文件 需要 写 到 磁盘 上 ， 增 加 了 被 破解 的 风险 。 

Dalvik 虚拟 机 内 核 仅 支持 从 dex 文件 加 载 类 的 方式 是 不 灵活 的 ， 由 于 没有 非常 深入 的 研究 
内 核 ， 目 前 还 不 能 确定 是 Dalvik 虚拟 机 本 身 不 支持 还 是 Android 在 移植 时 将 其 删除 了 。 不 过 相 
信 Dalvik 或 者 是 Android 开源 项 目 都 正在 向 能 够 支持 raw 数据 定义 类 方向 努力 。 

我 们 可 以 在 帮助 文档 中 看 到 : Jar or APK file with "classes.dex". (May expand this to include 
"raw DEX" in the future); 在 Android 的 Dalvik 源码 中 我 们 也 能 看 到 RawDexFile 的 身影 ， 只 是 
没有 具体 实现 而 已 。 

«Q 
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在 RawDexFile 诞生 之 前 , 我 们 都 只 能 使 用 这 种 存在 一 定 风 险 的 加 密 方 式 。 需 要 注意 释放 的 
dex 文件 路 径 及 权限 管理 。 另 外 在 加 载 完 毕 类 之 后 ,除非 出 于 其 他 的 目的 ， 否则 应 该 马上 删除 临 
时 的 解密 文件 。 


6.6 Android 动态 加 载 jar 和 DEX 


在 目前 的 软 硬 件 环境 下 ，Native App 与 Web App 在 用 户 体验 上 有 着 明显 的 优势 。 但 是 在 实 
际 项 目 应 用 中 ， 有 些 会 因为 业务 的 频繁 变更 而 频繁 的 升级 客户 端 ， 造 成 较 差 的 用 户 体验 ， 而 这 
也 正 是 Web App 的 优势 。 在 接 下 来 的 内 容 中 , 将 简要 讲解 Android 动态 加 载 jar 文件 和 dex 文件 
的 基本 过 程 。 


6.6.1 Android 的 动态 加 载 


在 Android 系统 中 可 以 实现 动态 加 载 ， 但 是 无 法 像 在 Java 中 那样 方便 地 动态 加 载 jar。 这 是 
因为 Android 虚拟 机 (Dalvik VM) 181] Java 打出 jar 的 byte code， 需 要 通过 dx 工具 来 优化 转换 
成 Dalvik byte code 后 才 行 。 这 一 点 在 Android 项 目 打 包 的 apk 中 可 以 看 出 : 引入 其 他 Jar 的 内 容 
都 被 打包 进 了 classes.dex。 

在 当前 的 Android 应 用 中 ， 有 如 下 两 个 API 可 以 实现 动态 加 载 功 能 。 

口 DexClassLoader: 这 个 可 以 加 载 “jar/apk/dex”， 也 可 以 从 SD 卡 中 加 载 , 也 是 本 节 的 重点 。 

Q PathClassLoader: 只 能 加 载 已 经 安装 到 Android 系统 中 的 APK 文件 。 


6.6.2 ”演练 动态 加 载 


在 接 下 来 的 内 容 中 ， 将 演示 动态 加 载 开源 项 目 “goodev-demo” 的 过 程 ， 具 体 流程 如 下 。 

(1) 下 载 开源 项 目 “goodev-demo”， 下 载 页 面 是 http://code.google.com/p/goodev-demo。 

(2) 将 项 目 导入 Eclipse 工程 , 如 果 工 程 报错 , 则 说 明 少 了 gen 文件 夹 ， 只 需 手 动 添加 即 可 。 
本 开源 项 目 是 从 网 上 下 载 优化 好 的 jar( 已 经 优化 成 dex 然后 再 打包 成 的 jar) 到 本 地 文件 系统 ， 然 
后 再 从 本 地 文件 系统 加 载 并 调用 的 。 下 面 的 内 容 将 演示 从 SD 卡 加 载 的 流程 。 

(3) 开始 查看 编写 接口 和 实现 ， 首 先 看 接口 Itynamic 的 具体 实现 。 

package com.dynamic; 


public interface IDynamic { 
public String helloWorld(); 
} 


(4) 再 看 实现 类 DynamicTest 的 代码 。 


package com.dynamic; 
public class DynamicTest implements IDynamic ( 
@Override 
public String helloWorld() { 
return "Hello World!"; 
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(5) 接 下 来 开始 打包 并 转 成 dex， 首 先 选中 工程 并 导出 常规 流程 ， 如 图 6-2 所 示 。 


pu la :8 
ASEA ee roy JAR File Specification 
I8 Package Explorer £3 A =| Define which resources should be exported into the JAR. 
BSle 
4 Dandroid-custom-classloading} Select the resources to export 
4 (9 src 4 WI GS android-custom-class-loading: ^ || [V| 国 DynamicTestjava 
4 Hi com BAs | Vi D IDynamicjava 
4 8 dynamic 回击 com.dynamic] 1 
国 DynamicTestjava El 8 com.example.dex 一 
B] 1Dynamicjava E B comexample.dexiio 
4 8B example.dex F7 G9 gen 
§B lib El © assets 
B) Ubraryinterfacejq | | SL the x z 
B) MainActivityjava | 一 
m Android 2.3.1 [Vi Export generated class files and resources 
B® gen [Generated Java Files] | E Export all output folders for checked projects 
Bs assets El Export Java source files and resources 
Es libs P Export refactorings for checked projects. Select refactorings... 
» Bs res 
回 AndroidManifestxml Select the export destination: 


6-2 导出 常规 流程 


HER: 笔者 在 实践 时 发 现 ， 如 果 自 己 新 建 一 个 Java 工程 ， 然 后 导出 jar 文件 是 无 法 使 用 的 ， 此 
处 打包 导出 为 dynamic jar. 


(6) 将 打包 好 的 jar 复制 到 SDK 安装 目录 “android-sdk-windows\platform-tools” 中 ， 使 用 
DOS 命令 进入 这 个 目录 ， 执 行 如 下 命令 : 


dx --dex --output-test.jar dynamic.jar 


(7) 接 下 来 开始 修改 调用 例子 ， 修 改 MainActivity 的 代码 如 下 。 


@Override 

public void onCreate(Bundle savedInstanceState) { 
super.onCreate (savedInstanceState) ; 
setContentView(R.layout.main); 
mToastButton - (Button) findViewById(R.id.toast button); 


// Before the secondary dex file can be processed by the DexClassLoader, 

// it has to be first copied from asset resource to a storage location. 
//final File dexInternalStoragePath = new File(getDir("dex", Context.MODE PRIVATE), 
SECONDARY DEX NAME) ; 


// if (!dexInternalStoragePath.exists()) { 

"ni mProgressDialog - ProgressDialog.show(this, 

PN getResources () .getString(R.string.diag title), 

yi getResources().getString(R.string.diag message), true, false); 
// // Perform the file copying in an AsyncTask. 

// // 从 网 络 下 载 需要 的 dex 文 件 

(new PrepareDexTask () ) .execute (dexInternalStoragePath) ; 

7) ) eise { 

// mToastButton.setEnabled (true); 

T } 
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mToastButton.setOnClickListener (new View.OnClickListener () { 
public void onClick(View view) { 
// Internal storage where the DexClassLoader writes the optimized dex file to. 
//final File optimizedDexOutputPath = getDir("outdex", Context.MODE PRIVATE); 
final File optimizedDexOutputPath = 
new File (Environment .getExternalStorageDirectory() .toString() 
+ File.separator + "test.jar"); 
// Initialize the class loader with the secondary dex file. 
//DexClassLoader cl = 
new DexClassLoader (dexInternalStoragePath.getAbsolutePath(), 
// optimizedDexOutputPath.getAbsolutePath(), 
// null, 
// getClassLoader()); 
DexClassLoader cl - 
new DexClassLoader (optimizedDexOutputPath.getAbsolutePath(), 
Environment .getExternalStorageDirectory() .toString(), null, getClassLoader()); 
Class libProviderClazz = null; 
try { 
// Load the library class from the class loader. 
// 载 入 从 网 络 上 下 载 的 类 
//libProviderClazz = cl.loadClass("com.example.dex.lib.LibraryProvider"); 
libProviderClazz = cl.loadClass ("com.dynamic.DynamicTest"); 


// Cast the return object to the library interface so that the 

// caller can directly invoke methods in the interface. 

// Alternatively, the caller can invoke methods through reflection, 
// which is more verbose and slow. 

//LibraryInterface lib = (LibraryInterface) libProviderClazz.newInstance () ; 
IDynamic lib = (IDynamic)libProviderClazz.newInstance(); 


// Display the toast! 

/ /1ib.showAwesomeToast (view.getContext(), "hello 世界 !") ; 

Toast.makeText (MainActivity.this, lib.helloWorld(), Toast.LENGTH SHORT) .show() ; 
} catch (Exception exception) { 

// Handle exception gracefully here. 

exception.printStackTrace() ; 


nh: 
| 


这 样 经 过 修改 ， 执 行 后 的 效果 如 图 6-3 所 示 。 
在 导出 jar 时 不 能 带 接口 文件 ， 否 则 会 报 出 如 下 错误 : 


java.lang.IllegalAccessError: Class ref in pre-verified class resolved to unexpected 
implementation 


另外 在 优化 jar 时 ， 应 该 重新 成 jar(jar->dex->jar)， 命 令 如 下 。 


dx --dex --output=test.jar dynamic.jar 
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图 6-3 执行 效果 
6.7 dex 文件 的 再 优化 


dex 文件 的 结构 是 紧凑 的 ， 但 是 如 果 我 们 还 想 要 求 运行 时 的 性 能 有 进一步 提高 ， 就 需要 对 
dex 文件 进行 进一步 优化 。 优 化 工作 主要 针对 以 下 几 个 方面 。 

(1) 调整 所 有 字段 的 字 节 序 (LITTLE_ENDIAN) 和 对 齐 结构 中 的 每 一 个 域 。 

(2) 验证 dex 文件 中 的 所 有 类 。 

(3) 对 一 些 特定 的 类 进行 优化 ， 对 方法 里 的 操作 码 进行 优化 。 

优化 后 的 文件 大 小 会 有 所 增加 ， 应 该 是 原 dex 文件 的 1 一 4 倍 。 

有 如 下 两 个 发 生 优化 的 时 机 : 

OQ ”对 于 预 置 应 用 ， 可 以 在 系统 编译 后 ， 生 成 优化 文件 ， 以 ODEX 结尾 。 这 样 在 发 布 时 
除 APK 文件 (不 包含 DEX) 以 外 ， 还 有 一 个 相应 的 ODEX 文件 。 

O ”对 于 非 预 置 应 用 ， 包 含 在 APK 文件 里 的 dex 文件 会 在 运行 时 被 优化 ， 优 化 后 的 文件 
将 被 保存 在 缓存 中 。 

代码 调用 的 流程 如 图 6-4 所 示 。 


图 6-4 ”代码 调用 流程 
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程序 也 和 自然 界 的 生物 一 样 ， 有 自己 的 生命 周期 。 应 用 程序 的 生命 周期 即 程序 的 存活 时 间 ， 
即 程序 在 什么 时 间 内 有 效 。 本 章 将 详细 讲解 Android 生命 周期 管理 的 基本 知识 ， 为 读者 步 入 本 
书后 面 知识 的 学 习 打 下 基础 。 


7.1 Android 程序 的 生命 周期 


Android 是 构建 在 Linux 上 的 开源 移动 开发 平台 ， 在 Android 中 ， 多 数 情况 下 每 个 程序 都 是 
在 各 自 独立 的 Linux 进程 中 运行 的 。 当 一 个 程序 或 其 某 些 部 分 被 请 求 时 ， 它 的 进程 就 “出 生 ” 
T: 当 这 个 程序 没有 必要 再 运行 下 去 且 系 统 需 要 回收 这 个 进程 的 内 存 用 于 其 他 程序 时 ， 这 个 进 
程 就 “死亡 ”了 。 由 此 可 以 看 出 ，Android 程序 的 生命 周期 是 由 系统 控制 而 非 由 程序 自身 直接 
控制 。 这 和 我 们 编写 桌面 应 用 程序 时 的 思维 有 一 些 不 同 ， 一 个 桌面 应 用 程序 的 进程 也 是 在 其 他 
进程 或 用 户 请 求 时 被 创建 ， 但 是 往往 是 在 程序 自身 收 到 关闭 请 求 后 执行 一 个 特定 的 动作 (比如 从 
main0 函 数 中 返回 ) 而 导致 进程 结束 的 。 要 想 做 好 某 种 类 型 的 程序 或 者 某 种 平台 下 的 程序 的 开发 ， 
最 关键 的 就 是 要 和 弄 清楚 这 种 类 型 的 程序 或 整个 平台 下 的 程序 的 一 般 工作 模式 , 并 将 其 熟 记 在 心 。 
在 Android 系统 中 ， 程 序 的 生命 周期 控制 就 是 属于 这 个 范畴 。 


7.1.1 进程 和 线程 


当 某 个 组 件 第 一 次 运行 时 ，Android 就 启动 了 一 个 进程 。 默 认 的 ， 所 有 的 组 
这 个 进程 和 线程 中 。 当然 也 可 以 安排 组 件 在 其 他 进程 或 者 线程 中 运行 
b manifest füle 控制 。 组 人 
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个 对 象 都 会 从 主线 程 中 分 离 。 一 般 来 说 ， 响 应 例如 View.onKeyDownO 用 户 操作 的 方法 和 通知 的 
方法 也 在 主线 程 中 运行 。 这 就 表示 ， 组 件 被 系统 调用 的 时 候 不 应 该 长 时 间 运 行 或 者 阻塞 操作 (如 
网 络 操作 或 者 计算 大 量 数据 )， 因 为 这 样 会 阻塞 进程 中 的 其 他 组 件 。 可 以 把 这 类 操作 从 主线 程 中 
分 离 出 去 。 

当 更 加 常用 的 进程 无 法 获取 足够 内 存 时 ，Android 可 能 会 关闭 不 常用 的 进程 。 下 次 启动 程序 
的 时 候 会 重新 启动 该 进程 。 

当 决 定 哪个 进程 需要 被 关闭 时 ，Android 会 考虑 哪个 进程 对 用 户 更 加 有 用 。 如 Android 会 倾 
向 于 关闭 一 个 长 期 不 显示 在 界面 的 进程 来 支持 一 个 经 常 显示 在 界面 的 进程 。 是 否 关 闭 一 个 进程 
决定 于 组 件 在 进程 中 的 状态 。 

即使 为 组 件 分 配 了 不 同 的 进程 ， 有 时 也 需要 再 分 配 线程 。 比 如 用 户 界面 需要 很 快 对 用 户 进 
行 响应 ， 因 此 某 些 费时 的 操作 ， 如 网 络 连 接 、 下 载 或 者 非常 占用 服务 器 时 间 的 操作 应 该 放 到 其 
他 进程 中 。 

线程 通过 Java 的 标准 对 象 Thread 创建 。 在 Android 中 提供 了 很 多 方便 管理 线程 的 方法 一 一 
Looper， 在 线程 中 运行 一 个 消息 循环 : Handler 传递 一 个 消息 ; HandlerThread 创建 一 个 带 有 消息 
循环 的 线程 。 


7.1.2 ”进程 的 类 型 


开发 者 必须 理解 不 同 的 应 用 程序 组 件 ， 尤 其 是 Activity. Service 和 Intent Receiver。 了 解 这 
些 组 件 是 如 何 影响 应 用 程序 的 生命 周期 ， 是 非常 重要 的 。 如 果 不 能 正确 地 使 用 这 些 组 件 ， 可 能 
会 导致 系统 终止 正在 执行 重要 任务 的 应 用 程序 进程 。 

一 个 常见 的 进程 生命 周期 漏洞 的 例子 是 Intent Receiver( 意 图 接收 器 )， 当 Intent Receiver 在 
onReceive() 方 法 中 接收 到 一 个 Intent( 意 图 ) 时 ， 它 会 启动 一 个 线程 ， 然 后 返回 。 一 旦 返回 ， 系 统 
将 认为 Intent Receiver 不 再 处 于 活动 状态 , 因而 Intent Receiver 所 在 的 线程 也 就 不 再 有 用 了 (除非 
该 进程 中 还 有 其 他 的 组 件 处 于 活动 状态 )。 因 此 ， 系 统 可 能 会 在 任意 时 刻 终止 该 线程 以 回收 占有 
的 内 存 。 这 样 进程 中 创建 出 的 那个 线程 也 将 被 终止 。 解 决 这 个 问题 的 方法 是 从 Intent Receiver 
中 启动 一 个 服务 ， 让 系统 知道 该 进程 中 还 有 处 于 活动 状态 的 工作 。 为 了 使 系统 能 够 正确 决定 在 
内 存 不 足 时 应 该 终止 哪个 进程 ，Android 根据 每 个 进程 中 运行 的 组 件 及 组 件 的 状态 把 进程 放 入 
一 个 Importance Hierarchy( 重 要 性 分 级 ) 中 。 进 程 的 类 型 按 重要 程度 排序 包括 如 下 5 种 。 

(1) 前 台 进 程 (Foreground) 

前 台 进 程 与 用 户 当前 正在 做 的 事情 密切 相关 。 不 同 的 应 用 程序 组 件 能 够 通过 不 同 的 方法 将 
它 的 宿主 进程 移 到 前 台 。 在 如 下 的 任何 一 个 条 件 下 : 进程 正在 屏幕 的 最 前 端 运行 一 个 与 用 户 交 
互 的 活动 (Activity), 它 的 onResume() 方 法 被 调用 ; 或 进程 有 一 个 正在 运行 的 Intent Receiver( 它 的 
IntentReceiver.onReceive() 方 法 正在 执行 ); 或 进程 有 一 个 服务 (Service)， 并 且 在 服务 的 某 个 回调 
函数 (Service.onCreate()、 Service.onStart0 或 Service.onDestroy0) 内 有 正在 执行 的 代码 ， 系 统 将 
把 进程 移动 到 前 台 。 

(2) 可 见 进程 (Visible) 

可 见 进程 有 一 个 可 以 被 用 户 从 屏幕 上 看 到 的 活动 ,但 不 在 前 台 ( 它 的 onPause0 方 法 被 调用 )。 
例如 ， 如 果 前 台 的 活动 是 一 个 对 话 框 ， 以 前 的 活动 就 隐藏 在 对 话 框 之 后 ， 就 会 现 这 种 进程 。 可 
见 进程 非常 重要 ， 一 般 不 允许 被 终止 ， 除 非 是 了 保证 前 台 进程 的 运行 而 不 得 不 终止 它 。 
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(3) 服务 进程 (Service) 

服务 进程 拥有 一 个 已 经 用 startService0 方 法 启动 的 服务 。 虽 然 用 户 无 法 直接 看 到 这 些 进程 ， 
但 它们 做 的 事情 却 是 用 户 所 关心 的 (如 后 台 MP3 回放 或 后 台 网 络 数据 的 上 传 下 载 )。 因 此 ， 系 统 
将 一 直 运 行 这 些 进程 ， 除 非 内 存 不 足以 维持 所 有 的 前 台 进程 和 可 见 进程 。 

(4) 后 人 台 进 程 (Background) 

后 台 进 程 拥有 一 个 当前 用 户 看 不 到 的 活动 ( 它 的 onStop0 方 法 被 调用 )。 这 些 进程 对 用 户 体验 
没有 直接 的 影响 。 如 果 它 们 正确 执行 了 活动 生命 周期 ， 系 统 可 以 在 任意 时 刻 终止 该 进程 以 回收 
内 存 ， 并 提供 给 前 面 三 种 类 型 的 进程 使 用 。 系 统 中 通常 有 很 多 这 样 的 进程 在 运行 ， 因 此 要 将 这 
些 进程 保存 在 LRU 列表 中 ， 以 确保 当 内 存 不 足 时 用 户 最 近 看 到 的 进程 最 后 一 个 被 终止 。 

(5) 空 进程 (Empty) 

空 进程 不 拥有 任何 活动 的 应 用 程序 组 件 的 进程 。 保 留 这 种 进程 的 唯一 原因 是 在 下 次 应 用 程 
序 的 某 个 组 件 需 要 运行 时 ， 不 需要 重新 创建 进程 ， 这 样 可 以 提高 启动 速度 。 

系统 将 以 进程 中 当前 处 于 活动 状态 组 件 的 重要 程度 为 基础 对 进程 进行 分 类 。 进 程 的 优先 级 
可 能 也 会 根据 该 进程 与 其 他 进程 的 依赖 关系 而 增长 。 例 如 ， 如 果 进 程 A 通过 在 进程 B 中 设置 
Context.BIND AUTO CREATE 标记 或 使 用 ContentProvider 被 绑 定 到 一 个 服务 (Service), 那么 进 
FEB 在 分 类 时 至 少 要 被 看 成 与 进程 A 同等 重要 。 


7.2 Activity 的 生命 周期 


在 Android 中 ， 一 般 用 系统 管理 来 决定 进程 的 生命 周期 。 有 时 因为 手机 所 具有 的 一 些 特殊 
性 ， 所 以 我 们 需要 更 多 地 关注 各 个 Android 程序 部 分 的 运行 时 生命 周期 模型 。 所 谓 手机 的 特殊 
性 ， 主 要 是 指 如 下 两 点 。 

(1) 在 使 用 手机 应 用 时 ， 大 多 数 情况 下 只 能 在 手机 上 看 到 一 个 程序 的 一 个 界面 ， 用 户 除了 
通过 程序 界面 上 的 功能 按钮 在 不 同 的 窗 体 间 切 换 外 ， 还 可 以 通过 Back( 返 回 ) 键 和 Home( 主 ) 键 来 
返回 上 一 个 窗口 ， 而 用 户 使 用 Back 或 者 Home 键 的 时 机 是 非常 不 确定 的 ， 任 何 时 候 用 户 都 可 以 
使 用 Home 或 Back 键 来 强行 切换 当前 的 界面 。 

Q) 通常 手机 上 一 些 特殊 的 事件 发 生 也 会 强制 的 改变 当前 用 户 所 处 的 操作 状态 ， 例 如 无 论 
任何 情况 ， 在 手机 来 电 时 ， 系 统 都 会 优先 显示 电话 接听 的 界面 。 

了 解 了 手机 应 用 的 上 述 特殊 性 后 ， 接 下 来 将 详细 介绍 Activity 在 不 同 阶段 的 生命 周期 。 


7.2.4 Activity 的 几 种 状态 


要 想 了 解 Activity 在 不 同 阶段 的 生命 周期 ， 首 先 需要 了 解 Activity 的 几 种 状态 。 当 Activity 
被 创建 或 销毁 时 ， 会 存在 如 下 4 种 状态 。 

口 ”Active( 活 动 ): “4 Activity 在 栈 的 顶端 时 ， 它 是 可 见 的 ， 有 焦点 的 前 台 Activity， 用 来 响 
应 用 户 的 输入 。Android 会 不 惜 一 切 代价 来 尝试 保证 它 的 活跃 性 ， 需 要 的 话 它 会 取消 栈 
中 更 靠 下 的 Activity 来 保证 活动 Activity 所 需要 的 资源 。 当 另 一 个 Activity Æ Active 
状态 时 ， 这 个 Activity 就 会 变 成 Paused。 

Q Paused(#(#): 在 一 些 情况 下 ， 你 的 Activity 可 见 但 不 拥有 焦点 ; 在 这 个 时 刻 ， 它 就 是 
暂停 的 。 当 最 前 面 的 Activity 是 全 透明 或 非 全 屏 的 Activity 时 ， 下 面 的 Activity 就 会 到 
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达 这 个 状态 。 当 暂停 时 ， 这 个 Activity 还 是 被 看 作 是 Active 的 ， 但 不 接受 用 户 的 输入 
事件 。 在 极端 的 情况 下 ，Android 会 取消 一 个 Paused 的 Activity 来 恢复 资源 给 Active 
Activity。 当 一 个 Activity 完全 不 可 见 时 ， 它 就 变 成 Stopped。 

O “Stopped( 停 止 ): 当 一 个 Activity 不 可 见 ， 它 就 “停止 ”了 。 这 个 Activity 仍然 留 在 内 存 
里 来 保存 所 有 的 状态 和 成 员 信息 ; 但 是 ， 当 系统 需要 内 存 时 ，Stopped Activity 就 会 被 
直接 取消 。 当 一 个 Activity 停止 时 , 保存 数据 和 当前 UI 状态 是 很 重要 的 。 一 旦 Activity 
退出 或 关闭 ， 它 就 变 成 Inactive。 

口 “Inactive( 销 毁 ): 当 一 个 曾经 被 启动 过 的 Activity 被 杀 死 时 ， 它 就 变 成 Inactive。Inactive 
Activity 会 从 Activity 栈 中 移 除 ， 当 它 重 新 显示 和 使 用 时 需要 再 次 启动 。 

Activity 状态 转换 图 如 图 7-1 所 示 。 


i Aclivity 局 动 
m onGreate() 
川 Back 键 关 
闭 此 Activity 
结 来 进 各 
5 个 活动 米 到 前 台 
Tu Jt Rus M NAI 
sene L| onPause0 fret 
5 个 活动 来 到 前 台 
+ 
onsaop0 
* 
onDestroy) 
— — 
销 弘 Activity 


7-1 Activity 状态 转换 图 


图 7-1 所 示 的 状态 的 变化 是 由 Android 内 存 管 理 器 决定 的 ，Android 会 首先 关闭 那些 包含 
Inactive Activity 的 应 用 程序 ， 然 后 关闭 Stopped 状态 的 程序 。 在 极端 情况 下 ，Android 也 会 移 除 
Paused 状态 下 的 程序 。 


7.2.2 ”分解 剖析 Activity 


(1) void onCreate(Bundle savedInstanceState) 
当 Activity 被 第 一 次 加 载 时 执行 onCreate0， 当 新 启动 一 个 程序 时 ， 其 主 窗 体 的 onCreate 事 
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件 就 会 被 执行 。 如 果 Activity 被 onDestroy( 销 毁 ) 后 ， 再 重新 加 载 Task( 任 务 ) 时 ， 其 onCreate0 事 
件 也 会 被 重新 执行 。 

(2) void onStart() 

在 onCreate 事件 之 后 执行 onStart0。 或 者 当前 窗 体 被 交换 到 后 台 后 ， 在 用 户 重 新 查看 窗 体 
前 已 经 过 去 了 一 段 时 间 ， 窗 体 已 经 执行 了 onStop0 事 件 ， 但 是 窗 体 和 其 所 在 进程 并 没有 被 销毁 ， 
用 户 重新 查看 窗 体 时 会 执行 onRestart0 事 件 ， 之 后 会 跳 过 onCreate0 事 件 ， 直 接 执行 窗 体 的 
onStart0 事 件 。 

(3) void onResume() 

在 onStart0 事 件 之 后 执行 void onResume。 或 者 当前 窗 体 被 交换 到 后 台 后 ， 在 用 户 重新 查看 
窗 体 时 ， 窗 体 还 没有 被 销毁 ， 也 没有 执行 过 onStop0 事 件 ( 窗 体 还 继续 存在 于 任务 中 )， 则 会 跳 过 
窗 体 的 onCreate0 和 onStart0 事 件 ， 直 接 执行 onResume0 事 件 。 

(4) void onPause() 

窗 体 被 交换 到 后 台 时 执行 onPause()。 

(5) void onStop() 

onPause0 事 件 之 后 执行 onStop0。 如 果 一 段 时 间 内 用 户 还 没有 重新 查看 该 窗 体 , 则 该 窗 体 的 
onStop0 事 件 将 会 被 执行 ， 或 者 用 户 直 接 按 了 Back 键 ， 将 该 窗 体 从 当前 任务 中 移 除 ， 也 会 执行 
该 窗 体 的 onStop0 事 件 。 

(6) void onRestart() 

onStop 事件 执行 后 执行 onRestart0， 如 果 窗 体 和 其 所 在 的 进程 没有 被 系统 销毁 ， 此 时 用 户 
又 重新 查看 该 窗 体 ， 则 会 执行 窗 体 的 onRestart 事件 ，onRestart 事件 后 会 跳 过 窗 体 的 onCreate() 
事件 直接 执行 onStart0 事 件 。 

(7) void onDestroy() 

Activity 被 销毁 的 时 候 执 行 onDestroy0。 在 窗 体 的 onStop0 事 件 之 后 ， 如 果 没 有 再 次 查看 该 
窗 体 ，Activity 则 会 被 销毁 。 


7.2.3 几 个 典型 的 场景 


根据 前 面 讲解 的 Activity 生命 周期 的 基本 知识 ， 可 以 总 结 出 如 下 几 个 典型 的 应 用 场景 。 

(1) Activity 从 被 装载 到 运行 ， 执 行 顺序 如 下 。 

onCreate() -> onStart()-» onResume(); 

这 是 一 个 典型 的 过 程 ， 发 生 在 Activity 被 系统 装载 运行 时 。 

Q) Activity 从 运行 到 暂停 ， 再 到 继续 回 到 运行 。 执 行 顺序 如 下 。 

onPause() -> onResume(); 

这 个 过 程 发 生 在 Activity 被 别 的 Activity 3E (E T 854) UL 失去 了 用 户 焦点 ,另外 那个 Activity 
退出 之 后 ， 这 个 Activity 再 次 获得 运行 。 在 这 个 过 程 中 ， 该 Activity 的 实例 是 一 直 存 在 。 

G) Activity 从 运行 到 停止 ， 执 行 顺 序 如 下 。 

onPause() -> onStop(); 

这 个 过 程 发 生 在 Activity 的 UI 完全 被 别 的 Activity XET, fA THAR. X 
个 过 程 中 Activity 的 实例 仍然 存在 。 比 如 , 当 Activity 正在 运行 时 , 用 户 按 了 Home 键 , 该 Activity 
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就 会 被 执行 这 个 过 程 。 

(4) Activity 从 停止 到 运行 ， 执 行 顺序 如 下 。 

onRestart()-» onStart()-» onResume(); 

处 于 Stopped 状态 并 且 实 例 仍 然 存在 的 Activity， 再 次 被 系统 运行 时 ， 执 行 这 个 过 程 。 这 个 
过 程 是 (3) 的 逆 过 程 ， 只 是 要 先 执行 onRestart0 而 重新 获得 执行 。 

(5) Activity 从 运行 到 销毁 ， 执 行 顺序 如 下 。 

onPause() -> onStop() -> onDestroy(); 

这 个 过 程 发 生 在 Activity 完全 停 掉 并 被 销毁 了 , 所 以 该 Activity 的 实例 也 就 不 存在 了 。 比如 ， 
当 Activity 正在 运行 时 ， 用 户 按 了 Back 键 ， 该 Activity 就 会 被 执行 这 个 过 程 。 这 个 过 程 可 看 作 
是 1 的 逆 过 程 。 

(6) 被 清除 出 内 存 的 Activity 重新 运行 ， 执 行 顺序 如 下 。 


onCreate() -> onStart()-» onResume(); 


这 个 过 程 对 用 户 是 透明 的 , 用 户 并 不 会 知道 这 个 过 程 的 发 生 , 看 起 来 和 (1) 的 执行 顺序 相似 ， 
不 同 的 是 如 果 保存 有 系统 被 清除 出 内 出 时 的 信息 ， 会 在 调用 onCreate0 时 ， 系 统 以 参数 的 形式 给 
出 ， 而 1 中 onCreate0 的 参数 为 null。 


7.24 38 Activity 的 生命 周期 


此 处 说 的 管理 Activity 的 生命 周期 ， 更 确切 地 说 应 该 是 参与 生命 周期 的 管理 ， 因 为 Android 
系统 框架 已 经 很 好 的 管理 了 这 其 中 的 绝 大 部 分 ， 应 用 开发 人 员 要 做 的 就 是 在 Android 的 框架 下 ， 
在 Activity 状态 转换 的 各 个 时 点 上 ， 做 出 自己 的 实现 ， 而 实现 这 些 要 做 的 只 是 在 你 的 Activity T 
类 里 面 Override 这 些 Activity 的 方法 即 可 。 

如 图 7-2 所 示 列 出 了 Activity 生命 周期 相关 的 方法 。 


Activity 
(from android.app) 


qf onCreate(savedInstanceState : Bundle) 

Fronstart() 

PonResume() 

FonPause() 

Ponstop() 

gonRestart() 

PonDestroy() 

SstartActivity(intent : Intent) 
SstartActivityForResult(intent : Intent, requestCode ; int) 
qfonActivityResult(requestC ode : int, resultCode : int, data : Intent) 
*attach(context : Context, aThread : ActivityThread, ...) 


72 Activity 生命 周期 相关 的 方法 
7.2.5 Activity 的 实例 化 与 启动 


Activity 的 实例 化 工作 是 由 Android 系统 完成 的 ， 在 用 户 点 击 执行 一 个 Activity 或 者 另 一 个 
Activity 需要 这 个 Activity 执行 时 ， 如 果 该 Activity 的 实例 不 存在 ，Android 系统 都 会 实例 化 之 ， 
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并 在 该 Activity 所 在 进程 的 主线 程 中 调用 该 Activity 的 onCreate0 方 法 ， 实 现 Activity 实例 化 时 
的 工作 。 

所 以 ，Activity::onCreate0 是 系统 实例 化 Activity 时 ，Activity 可 做 的 自身 初始 化 的 时 机 。 在 
这 里 可 以 实例 化 变量 ， 调 用 Activity::setContentView0 设 置 Ul 显示 内 容 。 

一 般 来 说 ， 在 Activity 实例 化 之 后 就 要 启动 该 Activity， 这 样 会 在 该 Activity 所 在 进程 的 主 
线程 中 顺序 调用 Activity 的 onStart0)，onResume0。 在 Activity 的 生命 周期 的 典型 时 序 中 ， 一 般 
onStart0 在 所 有 的 时 序 中 都 不 是 很 特别 的 过 程 ， 所 以 一 般 不 怎么 实现 。 

如 图 7-3 所 示 为 Activity 实例 化 与 启动 的 时 序 。 


— : Bundle) 
l 3: onstart( ) 
l 4: onResume( ) 


7-3 Activity 实例 化 与 启动 的 时 序 
这 里 从 应 用 开发 者 角度 来 说 明 问 题 ， 暂 不 考虑 Android 内 部 的 实现 细节 ， 所 以 各 种 动作 的 
发 起 者 统一 用 AndroidSystem 来 说 明 ， 而 从 Activity 这 边 看 过 去 ， 所 有 这 些 操作 也 都 是 异步 的 。 
onCreate( 在 Activity 存续 期 内 ， 只 会 被 调用 一 次 。 如 生命 周期 图 中 的 时 序 (6) 的 情形 其 实 是 
另外 又 启动 了 一 个 Activity 的 实例 ， 并 通过 onCreate0 的 参数 传递 进 先前 杀 掉 的 Activtiy 里 保留 
的 信息 。 因 为 onStart0 可 因为 已 经 停止 了 , 再 次 执行 而 被 调用 多 次 。 onResume0 可 以 因为 Activity 
的 Paused/Resumed 的 不 停 转换 ， 而 被 频繁 调用 。 


7.2.6 Activity 的 暂停 与 继续 


2: 


o 


统 进入 睡眠 或 被 一 个 对 话 框 打 断 的 情况 。 而 在 被 暂停 之 前 ， 系 统 会 通过 onPauseQib Activity 有 
保留 被 暂停 前 状态 的 时 机 。Activity 可 以 在 onPause0 中 , 保存 所 做 的 修改 到 永久 存储 区 , 停止 动 
画 显示 。onPauseO 里 的 操作 必须 简短 并 快速 返回 ， 因 为 在 onPause0 返 回 之 前 不 会 调 入 其 他 的 
Activity。 

此 时 Activity 因为 还 有 部 分 UI 显示 ， 它 通常 与 Window Manager 的 链接 还 在 ， 所 以 一 般 UI 
的 修改 不 需 保留 。 即 便 在 极端 的 情况 下 ，Paused 的 Activity 所 在 的 进程 被 杀 死 ， 那 也 是 极端 情 
况 ， 那 种 情况 下 ， 不 可 能 使 Activity 的 UI 显示 完整 一 致 。 

系统 在 被 唤醒 或 者 在 打 断 它 的 对 话 框 消失 之 后 ， 会 继续 运行 ， 此 时 系统 会 调用 Activity 的 
onResume() 方 法 。 在 onResume() 方 法 中 可 以 做 与 onPause0 中 相对 应 的 事情 。 

图 7-4 中 演示 了 一 个 Activity 启动 同一 个 进程 内 另外 一 个 Activity 的 时 序 图 。 
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Activity System. 
RO me m : Intent) T 
—— | | 
2 
J = -[to-be-started : 
| ‘Ach vity 
5: onCreste(sa ved InstanceState 


6: onstart( ) 


4:onPause() Lj 
i I ad 
| 
| 
| 


7: onResume ) 


# starter is absolutely invisible 
8: onStop( ) T 


T | 
7-4 —^ Activity 启动 另 一 个 Activity 的 时 序 图 
图 7-4 可 以 很 好 地 说 明 一 个 Activity 启动 时 , 与 另外 一 个 Activity 之 间 的 各 种 PAUSE/RESUME 
交互 过 程 。 在 此 需要 注意 ，PAUSE/RESUME 是 众多 Activity 状态 转换 中 的 一 个 子 集 ， 很 多 其 他 
的 场景 也 需要 经 过 这 个 过 程 。 


7.2.7 Activity 的 关闭 /销毁 与 重新 运行 


Activity 被 Stopped 可 能 是 完全 被 别 的 Activity 覆盖 掉 了 , 也 可 能 是 用 户 显 式 地 按 了 Back 或 
Home 键 。Activity 被 Stopped 之 前 ， 它 的 onStop() 方 法 会 被 提前 调用 ,来 做 些 停止 前 的 处 理 。 如 
果 处 于 Stopped 的 Activity 再 次 运行 ， 它 的 onRestart() 方 法 会 被 调用 ， 这 是 区 分 其 他 调用 场景 ， 
比较 合适 的 实现 处 理 的 地 方 。 

因为 处 于 Paused 状态 的 Activity 在 内 存 极端 不 足 的 情况 下 ， 它 所 在 的 进程 也 可 能 被 取消 ， 
这 样 onStop0 在 被 取消 前 , 不 一 定 会 被 调用 , 所 以 onPause0 是 比 onStop0 更 合适 的 保留 信息 到 永 
久 存 储 区 的 时 机 。 

Activity 被 销毁 可 能 是 显 式 地 按 了 Back 键 ， 也 可 能 是 处 于 Paused 或 Stopped 状态 ， 因 为 内 
存 不 足 而 被 销毁 。 还 有 一 种 情况 是 配置 信息 改变 (比如 屏 的 方向 改变 ) 后 ， 根 据 设 置 需 要 销毁 掉 所 
有 的 Activity( 是 否 关闭 还 要 看 Activity 自己 的 配置 )， 再 重新 运行 它们 。 

被 系统 隐 式 销毁 的 Activity, 在 被 销毁 (onStop0 调 用 ) 之 前 ,一 般 的 会 调用 onSaveInstanceState0) 
保留 该 Activity 此 时 的 状态 信息 。 该 方法 中 传 入 Bundle 参数 ， 可 在 此 方法 中 把 此 时 的 状态 信息 
写 入 ， 系 统 保留 这 些 。 而 当 该 Activty 再 次 被 实例 化 运行 时 ， 系 统 会 把 保留 在 Bundler 的 信息 再 
次 以 参数 形式 ， 通 过 onCreate0 方 法 传 入 。 

通常 在 onSaveInstanceState0 中 保留 UI 的 信息 ， 永 久 存储 的 信息 最 好 还 是 在 onPause0 中 保 
存 。Activity 的 onSaveInstanceState0 已 经 缺 省 实现 来 保留 通用 View 的 UI 信息 ， 所 以 不 管 是 否 
保留 当前 Activity 的 信息 , 通常 都 要 在 onSaveInstanceState0 中 先 调用 super.onSavelnstanceState() 
来 保留 通用 的 UI 信息 。 


«Q 


e 深入 理解 Android 虚拟 机 -t 


a H 


7.2.8 Activity 的 启动 模式 


在 Android 系统 中 ， 有 如 下 4 种 启动 Activity 的 模式 。 
m ”standard( 默 认 ) 
口 singleTop 
口 singleTask 
口 singleInstance 
上 述 四 种 模式 分 别 在 文件 AndroidManifestxml 中 配置 ， 另 外 也 可 以 在 intent 启动 Activity 
时 添加 必要 参数 来 设置 。 配 置 代码 如 下 。 
<activity 
android:configChanges="mcc|mnc|locale|touchscreen|keyboard|keyboardHidden| 
navigation| screenLayout |fontScale|uiMode|orientation" 
<span style="color: #e53333; ">android: launchMode="singleTask"</span> 
android:screenOrientation ="portrait" 
android: windowSoftInputMode="adjustPan" 
android:name=".activity.ShowHowAct" > 
接 下 来 开始 一 一 说 明 这 4 种 模式 的 基本 特征 。 
(1) standard( 默 认 ) 
这 是 Android 的 Activity 的 默认 模式 ， 如 果 没 有 配置 android:launchMode， 则 默认 是 这 个 模 
式 。 在 该 模式 下 ， 一 个 Activity 可 以 同时 被 添加 到 多 个 任务 中 ， 并 且 一 个 任务 可 以 有 多 个 实例 ， 
且 每 次 通过 intent 启动 时 ， 都 会 生成 一 个 新 的 实例 。 
(2) singleTop 
该 属性 和 standard 较 类 似 , 不 同 的 地 方 就 是 , 当当 前 的 Activity 实例 在 当前 任务 的 栈 项 ,intent 
启动 时 ， 则 不 生成 新 的 实例 ， 会 重用 (不 生成 新 的 实例 ) 原 有 的 实例 ， 如 果 显 式 地 指定 intent 的 参 
4 FLAG ACTIVITY NEW_TASK。 如 果 提 供 了 FLAG ACTIVITY NEW TASK 参数 ， 会 启动 
到 别 的 任务 里 。 
(3) singleTask 
在 该 模式 下 , Activity 只 会 有 一 个 实例 。 WR MESH OA, Activity 的 一 个 实例 存在 ， 
则 不 再 启动 新 的 ， 每 次 都 会 被 重用 (重用 就 是 如 果 该 Activity 在 task 的 栈 底 ， 则 会 被 调 到 栈 项 )， 
且 可 以 和 其 他 的 Activity 共存 于 一 个 任务 中 。 
(4) singleInstance 
该 模式 和 singleTask 一 样 ， 唯 一 不 同 的 就 是 ， 在 该 模式 下 ，Activity 会 独自 拥有 一 个 task 
不 会 和 其 他 Activity 公用 ， 每 次 Activity 都 会 被 重用 ， 且 全 局 只 能 有 一 个 实例 。 


7.3 Android 进程 与 线程 
当 某 个 组 件 第 一 次 运行 的 时 候 ，Android 启动 了 一 个 进程 。 默认 的 ， 所 有 的 组 件 和 程序 运行 


在 这 个 进程 和 线程 中 。 也 可 以 安排 组 件 在 其 他 的 进程 或 者 线程 中 运行 。 本 节 将 简要 介绍 Android 
进程 与 线程 的 基本 知识 。 
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7.3.1 进程 


组 件 运行 的 进程 由 Manifest File 控制 ， 组 件 中 的 节点 <activity>、<service>、<receiver> 和 
<provider> 都 包含 了 一 个 Process 属性 。 通 过 Process 属性 ， 可 以 设置 组 件 运行 的 进程 ， 既 可 以 配 
置 组 件 在 一 个 独立 进程 中 运行 ， 也 可 以 配置 多 个 组 件 在 同一 个 进程 中 运行 ， 甚 至 可 以 配置 多 个 
程序 在 同一 个 进程 中 运行 (前 提 是 这 些 程序 共享 一 个 User ID 并 给 定 了 同样 的 权限 )。 另 外 ， 在 
<application> 节点 中 也 包含 了 Process 属性 ， 可 以 用 来 设置 程序 中 所 有 组 件 的 默认 进程 。 

所 有 的 组 件 在 此 进程 的 主线 程 中 实例 化 ， 系 统 对 这 些 组 件 的 调用 从 主线 程 中 分 离 。 并 非 每 
个 对 象 都 会 从 主线 程 中 分 离 。 一 般 来 说 ， 响 应 例如 View.onKeyDown0 用 户 操作 的 方法 和 通知 的 
方法 也 在 主线 程 中 运行 。 这 就 表示 ， 组 件 被 系统 调用 的 时 候 不 应 该 长 时 间 运 行 或 者 阻塞 操作 (如 
网 络 操作 或 者 计算 大 量 数据 )， 因 为 这 样 会 阻塞 进程 中 的 其 他 组 件 ， 因 此 可 以 把 这 类 操作 从 主线 
程 中 分 离 。 

当 更 加 常用 的 进程 无 法 获取 足够 内 存 ，Android 可 能 会 关闭 不 常用 的 进程 。 下 次 启动 程序 时 
会 重新 启动 进程 。 

当 决 定 哪个 进程 需要 被 关闭 时 ，Android 会 考虑 哪个 进程 对 用 户 更 加 有 用 。 如 Android 会 倾 
向 于 关闭 一 个 长 期 不 显示 在 界面 的 进程 来 支持 一 个 经 常 显示 在 界面 的 进程 ， 是 否 关闭 一 个 进程 
决定 于 组 件 在 进程 中 的 状态 。 


7.3.2 Xf 


即使 为 组 件 分 配 了 不 同 的 进程 ， 有 时 候 也 需要 再 分 配 线程 。 比 如 用 户 界面 需要 很 快 对 用 户 
进行 响应 ， 因 此 某 些 费时 的 操作 ， 如 网 络 连接 、 下 载 或 者 非常 占用 服务 器 时 间 的 操作 应 该 放 到 
其 他 线程 。 

线程 通过 Java 的 标准 对 象 Thread 创建 ， 在 Android 中 提供 了 如 下 管理 线程 的 方法 。 

O Looper: 在 线程 中 运行 一 个 消息 循环 。 

O Handler: 传递 一 个 消息 。 

O HandlerThread: 创建 一 个 带 有 消息 循环 的 线程 。 

Android 会 让 一 个 应 用 程序 在 单独 的 线程 中 ， 指 导 它 创建 自己 的 线程 。 除了 上 述 方法 外 , 通 
过 使 用 应 用 程序 组 件 ， 例 如 Activity、service、broadcast receiver， 可 以 在 主线 程 中 实现 实例 化 
操作 。 


7.3.3 ”线程 安全 的 方法 


了 解 了 进程 和 线程 的 基本 知识 后 ， 很 有 必要 了 解 线程 安全 方面 的 知识 。 在 某 些 情况 下 ， 方 
法 可 能 调用 不 止 一 个 线程 ,因此 需要 注意 方法 的 线程 安全 。 例 如 当 一 个 调用 在 IBinder( 是 一 个 接 
口 ， 是 对 跨 进程 的 对 象 的 抽象 ) 对 象 中 的 方法 的 程序 启动 了 和 IBinder 对 象 相同 的 进程， 方法 就 
在 IBinder 的 进程 中 执行 。 但 是 ， 如 果 调 用 者 发 起 另外 一 个 进程 ， 方 法 在 另外 一 个 线程 中 运行 ， 
这 个 线程 在 和 IBinder 对 象 在 一 个 线程 池 中 ， 它 不 会 在 进程 的 主线 程 中 运行 。 如 果 一 个 Service 
从 主线 程 被 调用 onBind0 方 法 ，onBind0 返 回 的 对 象 中 的 方法 会 被 从 线程 池 中 调用 。 因 为 一 个 服 
务 可 能 有 多 个 客户 端 请 求 , 不 止 一 个 线程 池 会 在 同一 时 间 调 用 Binder 的 方法 , 所 以 此 时 IBinder 
必须 保证 线程 安全 。 
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7.4 测试 生命 周期 


经 过 本 书 前 面 内 容 的 学 习 ， 相 信 读 者 已 经 了 解 了 Android 生命 周期 的 基本 知识 。 本 节 将 通 
过 几 段 应 用 代码 来 测试 Android 的 生命 周期 。 
(1) 首先 看 MainActivity 的 代码 ， 这 是 软件 启动 时 默认 打开 的 Activity。 


package cn.itcast.life; 


import android.app.Activity; 
import android.content.Intent; 
import android.os.Bundle; 
import android.util.Log; 
import android.view.View; 
import android.widget.Button; 


public class MainActivity extends Activity { 
private static final String TAG - "MainActivity"; 


@Override 

public void onCreate(Bundle savedInstanceState) { 
super.onCreate (savedInstanceState) ; 
setContentView(R.layout.main) ; 
Log.i(TAG, "onCreate()") ; 


Button button = (Button) this. findViewById(R.id.button) ; 
button.setOnClickListener (new View.OnClickListener() { 


@Override 
public void onClick(View v) { 
Intent intent = new Intent (MainActivity.this, OtherActivity.class) ; 
startActivity (intent) ; 
} 
We 


Button threebutton = (Button) this.findViewById(R.id.threebutton) ; 
threebutton.setOnClickListener (new View.OnClickListener() { 


GOverride 

public void onClick(View v) { 
Intent intent = new Intent (MainActivity.this, ThreeActivity.class); 
startActivity (intent); 


Dh; 


GOverride 

protected void onDestroy() { 
Log.i(TAG, "onDestroy()"); 
super.onDestroy(); 
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GOverride 

protected void onPause() { 
Log.i(TAG, "onPause()") ; 
super .onPause () ; 


GOverride 

protected void onRestart() { 
Log.i(TAG, "onRestart()"); 
super.onRestart () ; 


} 


GOverride 

protected void onResume() { 
Log.i(TAG, "onResume()"); 
super.onResume(); 


} 


@Override 

protected void onStart() { 
Log.i(TAG, "onStart()"); 
super.onStart () ; 


} 


GOverride 

protected void onStop() { 
Log.i(TAG, "onStop()"); 
super.onStop(); 


} 
(2) 下 面 是 MainActivity 匹配 的 XML 布局 代码 。 


<?xml version="1.0" encoding="utf-8"?> 

«LinearLayout xmlns:android-"http://schemas.android.com/apk/res/android" 
android:orientation-"vertical" 
android:layout width-"fill parent" 
android:layout height-"fill parent" 
> 

<TextView 
android:layout width-"fill parent" 
android:layout height-"wrap content" 
android: text="@string/hello" 
/> 


«Button 
android:layout width-"wrap content" 
android:layout height-"wrap content" 
android: text="4] Ff OtherActivity" 
android: id="@+id/button" 
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/> 


«Button 
android:layout width-"wrap content" 
android:layout height-"wrap content" 
android:text-"i[Jf ThreeActivity" 
android: id="@+id/threebutton" 


/> 
</LinearLayout> 
(3) 下 面 是 一 个 新 的 Activity， 为 了 验证 “onstop” 方 法 ， 使 用 下 面 的 OtherActivity 将 前 面 
的 MainActivity 覆盖 掉 。 


package cn.itcast.life; 


import android.app.Activity; 
import android.os.Bundle; 


public class OtherActivity extends Activity { 


GOverride 

protected void onCreate(Bundle savedInstanceState) { 
// TODO Auto-generated method stub 
super.onCreate (savedInstanceState) ; 
setContentView(R. layout .other) ; 


} 
下 面 是 OtherActivity 匹配 的 XML 布局 代码 。 


<?xml version="1.0" encoding="utf-8"?> 
<LinearLayout 
xmlns:android="http: //schemas.android.com/apk/res/android" 
android:orientation="vertical" 
android: layout_width="fill parent" 
android: layout_height="fill parent"> 


<TextView 
android: layout_width="fill_ parent" 
android:layout height-"wrap content" 
android:text-"jXfé OtherActivity" 
/> 


</LinearLayout> 


(4) 下 面 的 ThreeActivity 用 于 测试 onpause 方法 ， 使 用 半 透 明 或 者 提示 框 的 形式 ， 履 盖 掉 
前 面 的 MainActivity。 


package cn.itcast.life; 


import android.app.Activity; 
import android.os.Bundle; 


public class ThreeActivity extends Activity { 
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GOverride 

protected void onCreate(Bundle savedInstanceState) { 
// TODO Auto-generated method stub 
super.onCreate (savedInstanceState) ; 
setContentView(R. layout .three) ; 


} 
下 面 是 ThreeActivity 匹配 的 XML 布局 代码 。 


<?xml version-"1.0" encoding="utf-8"?> 

«LinearLayout 
xmlns:android-"http://schemas.android.com/apk/res/android" 
android:layout width-"wrap content" 
android: layout_height="wrap content"» 


<TextView 
android: layout_width="fill_ parent" 
android:layout height-"wrap content" 
android: text=" =^ Activity" 
/> 


</LinearLayout> 


(5) 下 面 是 项 目 清单 文件 , 在 此 使 用 了 android:theme="(@android:style/Theme.Dialog" 来 设置 
Activity 的 样式 风格 的 弹出 框 。 


«?xml version-"1.0" encoding="utf-8"?> 
«manifest xmlns:android-"http://schemas.android.com/apk/res/android" 
package-"cn.itcast.life" 
android:versionCode-"1" 
android:versionName-"1.0"» 
«application android:icon-"édrawable/icon" android:label-"Gstring/app name" 
«activity android:name-".MainActivity" 
android: label="@string/app_name"> 
<intent-filter> 
<action android:name="android.intent.action.MAIN" /> 
<category android:name="android.intent.category.LAUNCHER" /> 
</intent-filter> 
</activity> 
«activity android:name=".OtherActivity" android:theme="@android:style/Theme.Dialog"/> 
<activity android:name=".ThreeActivity"/> 
</application> 
<uses-sdk android:minSdkVersion="8" /> 
</manifest> 


运行 上 述 程序 ， 如 果 在 Debug 状态 时 切换 到 DDMS 界面 ， 可 以 马上 看 到 所 打印 出 来 的 Log 
信息 ， 这 样 就 可 以 很 清楚 地 分 析 程序 的 运行 过 程 。 

Activity 的 onSaveInstanceState() 和 onRestoreInstanceState0) 并 不 是 生命 周期 方法 ， 它 们 不 同 
于 onCreate0 和 onPause() 等 生命 周期 方法 , 它们 并 不 一 定 会 被 触发 。 当 应 用 过 到 意外 情况 时 , 例 
如 内 存 不 足 、 用 户 直接 按 Home 键 等 操作 ， 当 系统 销毁 一 个 Activity 时 ，onSaveInstanceState() 
才 会 被 调用 。 但 是 当 用 户主 动 去 销毁 一 个 Activity 时 ， 例 如 在 应 用 中 按 Back 键 ， 
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onSavelInstanceState() 就 不 会 被 调用 。 因 为 在 这 种 情况 下 ， 用 户 的 行为 决定 了 不 需要 保存 Activity 
的 状态 。 通 常 onSaveInstanceStateO 只 适合 用 于 保存 一 些 临 时 性 的 状态 ， 而 onPause0 适 合用 于 数 
据 的 持久 化 保存 。 


7.5 Service 的 生命 周期 


在 本 章 前 面 的 内 容 中 , 已 经 讲解 了 Android 中 Activity 的 生命 周期 。 本 节 将 详细 讲解 Android 
中 Service 的 生命 周期 知识 ， 为 读者 步 入 本 书后 面 知识 的 学 习 打 下 基础 。 


7.5.1 Service 的 基本 概念 和 用 途 


Android 中 的 Service( 服 务 ) 与 Activity 不 同 ， 它 是 不 能 与 用 户 交 互 的 ， 不 能 自己 启动 的 ， 运 
行 在 后 台 的 程序 ， 如 果 我 们 退出 应 用 时 ，Service 进程 并 没有 结束 ， 它 仍然 在 后 台 运 行 ， 那 我 们 
什么 时 候 会 用 到 Service WE? 比如 我 们 播放 音乐 时 ， 有 可 能 想 边 听 音 乐 边 干 些 其 他 事情 ， 当 我 们 
退出 播放 音乐 的 应 用 ， 如 果 不 用 Service， 我 们 就 听 不 到 音乐 了 ， 所 以 这 时 候 就 得 用 到 Service 
了 ， 又 比如 当 我 们 一 个 应 用 的 数据 是 通过 网 络 获取 的 ， 不 同时 间 ( 一 段 时 间 ) 的 数据 是 不 同 的 ， 这 
时 候 我 们 可 以 用 Service 在 后 台 定时 更 新 ， 而 无 须 每 打开 应 用 的 时 候 在 去 获取 。 


7.5.2 Service 的 生命 周期 详解 


Android Service 的 生命 周期 并 不 像 Activity 那么 复杂 ， 它 只 继承 了 onCreate0、onStartO、 
onDestroy() 三 个 方法 ， 当 我 们 第 一 次 启动 Service 时 ,先后 调用 了 onCreate0 和 onStart0 这 两 个 方 
法 ， 当 停止 Service 时 ， 则 执行 onDestroy0 方 法 ， 这 里 需要 注意 的 是 ， 如 果 Service 已 经 启动 了 ， 
当 我 们 再 次 启动 Service 时 ， 不 会 在 执行 onCreate0 方 法 ， 而 是 直接 执行 onStart0 方 法 ， 具 体 的 
可 以 看 下 面 的 实例 。 


7.5.8 Service 5 Activity 通信 


Service 后 端的 数据 最 终 还 是 要 呈现 在 前 端 Activity 上 的 ， 因 为 启动 Service 时 ， 系 统 会 重新 
开启 一 个 新 的 进程 ， 这 就 涉及 到 不 同 进程 间 通 信 的 问题 了 (AIDL)， 此 处 不 作 过 多 描述 ， 当 我 们 
想 获取 启动 的 Service 实例 时 ， 我 们 可 以 用 到 bindService0 和 onBindService0 方 法 ， 它 们 分 别 执 
行 了 Service 中 IBinder0 和 onUnbind() 方 法 。 

为 了 让 大 家 更 容易 理解 Service 与 Activity 通信 过 程 ， 接 下 来 用 一 段 演示 代码 来 详细 讲解 。 

(1) 新 建 一 个 Android 工程 ， 命 名 为 ServiceDemo. 

(2) 修改 文件 main.xml， 在 此 增加 了 4 个 按钮 ， 具 体 代码 如 下 。 

<?xml version-"1.0" encoding="utf-8"?> 

«LinearLayout xmlns:android="http: //schemas.android.com/apk/res/android" 

android: orientation="vertical" 
android: layout_width="fill_parent" 


android:layout height-"fill parent" 
> 


Q^ 


第 7 章 生命 周期 管理 


«TextView 
android: id="@+id/text" 
android: layout width-"fill parent" 
android: layout_height="wrap content" 
android: text="@string/hello" 
/> 
<Button 
android: id="@+id/startservice" 
android: layout_width="fill_ parent" 


android:layout height-"wrap content" 
android:text-"startService" 

/> 

«Button 
android:id-"G«id/stopservice" 
android:layout width-"fill parent" 
android:layout height-"wrap content" 
android:text-"stopService" 

Js 

«Button 
android: id="@+id/bindservice" 

:layout width-"fill parent" 
android:layout height-"wrap content" 
android:text-"bindService" 

/» 

«Button 
android:id-"G«id/unbindservice" 
android:layout width-"fill parent" 
android:layout height-"wrap content" 
android:text-"unbindService" 

/» 

«/LinearLayout» 


(3) 新 建 一 个 Service， 命 名 为 MyService.java， 具 体 代码 如 下 。 


package com.tutor.servicedemo; 
import android.app.Service; 
import android.content.Intent; 
import android.os.Binder; 
import android.os.IBinder; 
import android.text.format.Time; 
import android.util.Log; 
public class MyService extends Service { 
// 定 义 一 个 Tag 标签 
private static final String TAG = "MyService"; 
// 这 里 定义 一 个 Binder 类 ， 用 在 onBind () 方 法 里 ， 这 样 Activity 那 边 可 以 获取 到 
private MyBinder mBinder = new MyBinder(); 
GOverride 
public IBinder onBind(Intent intent) { 
Log.e(TAG, "start IBinder---"); 
return mBinder; 
} 
GOverride 
public void onCreate() { 
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Log.e(TAG, "start onCreate---"); 
super.onCreate(); 


GOverride 

public void onStart(Intent intent, int startId) 
Log.e(TAG, "start onStart---"); 
super.onStart (intent, startId); 


GOverride 

public void onDestroy() { 
Log.e(TAG, "start onDestroy---"); 
super.onDestroy(); 


@Override 

public boolean onUnbind(Intent intent) { 
Log.e(TAG, "start onUnbind~~~") ; 
return super.onUnbind (intent); 


} 


// 这 里 写 了 一 个 获取 当前 时 间 的 函数 ， 不 过 没有 格式 化 
public String getSystemTime() { 


Time t = new Time(); 
t.setToNow() ; 
return t.toString(); 


} 


public class MyBinder extends Binder{ 
MyService getService() 


{ 
} 


return MyService.this; 


} 
(4) 修改 文件 ServiceDemo.java， 有 具体 代 码 如 下 。 


package com.tutor.servicedemo; 

import android.app.Activity; 

import android.content .ComponentName; 
import android.content.Context; 

import android.content.Intent; 

import android.content.ServiceConnection; 
import android.os.Bundle; 

import android.os.IBinder; 

import android.view.View; 

import android.view.View.OnClickListener; 
import android.widget.Button; 

import android.widget.TextView; 
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public class ServiceDemo extends Activity implements OnClickListener{ 


private MyService mMyService; 
private TextView mTextView; 
private Button startServiceButton; 
private Button stopServiceButton; 
private Button bindServiceButton; 
private Button unbindServiceButton; 
private Context mContext; 


// 这 里 需要 用 到 ServiceConnection ff Context .bindService fl context .unBindService () 里 用 到 
private ServiceConnection mServiceConnection = new ServiceConnection() { 
//4bindService M, ik Text View 显示 MyService # getSystemTime () 方 法 的 返回 值 
public void onServiceConnected(ComponentName name, IBinder service) { 
// TODO Auto-generated method stub 
mMyService = ((MyService.MyBinder) service) .getService(); 
mTextView.setText("I am frome Service :" « mMyService.getSystemTime()); 


} 


public void onServiceDisconnected(ComponentName name) { 
// TODO Auto-generated method stub 


} 
hi 
public void onCreate(Bundle savedInstanceState) { 
super.onCreate (savedInstanceState) ; 
setContentView(R.layout.main) ; 
setupViews () ; 


} 


public void setupViews () { 


mContext = ServiceDemo.this; 
mTextView = (TextView) findViewById(R.id.text) ; 


startServiceButton = (Button) findViewById(R.id.startservice) ; 
stopServiceButton = (Button) findViewById(R.id.stopservice) ; 
bindServiceButton = (Button) findViewById(R.id.bindservice) ; 
unbindServiceButton = (Button) findViewById(R.id.unbindservice) ; 


startServiceButton.setOnClickListener (this) ; 
stopServiceButton.setOnClickListener (this) ; 
bindServiceButton.setOnClickListener (this); 
unbindServiceButton.setOnClickListener (this); 


public void onClick(View v) { 
// TODO Auto-generated method stub 
if(v == startServiceButton) { 
Intent i = new Intent(); 
i.setClass(ServiceDemo.this, MyService.class) ; 
mContext .startService (i); 
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}else if(v == stopServiceButton) { 
Intent i = new Intent(); 
i.setClass(ServiceDemo.this, MyService.class) ; 
mContext .stopService (i) ; 

jelse if(v == bindServiceButton) { 
Intent i = new Intent(); 
i.setClass(ServiceDemo.this, MyService.class) ; 
mContext .bindService(i, mServiceConnection, BIND AUTO CREATE); 

jelse{ 
mContext .unbindService (mServiceConnection) ; 

} 


} 
(5) 修改 文件 AndroidManifest.xml 的 代码 ， 在 此 注册 新 建 的 MyService。 


«?xml version-"1.0" encoding="utf-8"?> 
«manifest xmlns:android-"http://schemas.android.com/apk/res/android" 
package-"com.tutor.servicedemo" 
android:versionCode-"1" 
android:versionName-"1.0"» 
«application android:icon- 
«activity android:name-".ServiceDemo" 
android:label-"Gstring/app name"» 
«intent-filter» 
«action android:name-"android.intent.action.MAIN" /» 
«category android:name-"android.intent.category.LAUNCHER" /» 
«/intent-filter» 
«/activity» 


"@drawable/icon" android:label="@string/app_name"> 


<service android:name=".MyService" android:exported="true"></service> 


</application> 
«uses-sdk android:minSdkVersion-"7" /> 
</manifest> 


执行 上 述 代 码 后 的 效果 如 图 7-5 所 示 。 


7-5 执行 效果 


当 单 击 startServie 按钮 时 ， 先 后 执行 了 Service 中 onCreate0->onStartO 这 两 个 方法 ， 如 果 打 


开 DDMS 的 Logcat 窗口 ， 会 看 到 如 图 7-6 所 示 的 界面 。 


pid tag Message 
254 MyService start onCreate~~~ 
254 MyService start onStart^""* 


图 7-6 Logcat 窗口 
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这 时 可 以 按 Home 键 进 入 Settings( 设 置 ) 一 Applications( 应 用 ) 一 Running Services( 正 在 运行 的 
服务 ) 查 看 新 启动 的 一 个 服务 ， 效 果 如 图 7-7 所 示 。 


Running services 
若 数 拼音 输入 法 


ServiceDemo 


p 


图 7-7 新 启动 了 一 个 服务 
当 点 击 stopService 按钮 时 ，Service 执行 了 onDestroy0 方 法 ， 效 果 如 图 7-8 Aras. 


pid tag Message 
254 MyService start onDestroy ~" 
7-8 Logcat 窗口 
如 果 此 时 再 次 单 击 startService 按钮 ， 然 后 单 击 bindService 按钮 (通常 bindService 都 是 bind 
已 经 启动 的 Service), Service 执行 了 IBinder0 方 法 ,以 及 TextView 的 值 也 有 所 变化 了 ,如 图 7-9 
和 图 7-10 所 示 。 


pid tag Message 
254 NyService start IBinder™”™ 


7-9 Logcat 窗口 


7-10 执行 效果 
最 后 单 击 unbindService 按钮 ， 则 Service 执行 了 onUnbind() 方 法 ， 如 图 7-11 所 示 。 


pid tag Message 
254 MyService —— — 


. start onUnbind~~~ - 


7-11 Logcat 窗口 
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7.6 Android 广播 的 生命 周期 


收听 收音 机 就 是 一 种 广播 ， 在 收音 机 中 有 很 多 个 广播 电台 ， 每 个 广播 电台 播放 的 内 容 都 不 
相同 。 接 受 广 播 时 广播 (发 送 方 ) 并 不 在 意 我 们 (接收 方 ) 接 收 到 广播 时 如 何 处 理 。 那 么 Android 中 
的 广播 是 如 何 操作 的 呢 ? 这 个 问题 将 在 下 面 的 内 容 中 进行 解答 。 

在 Android 系统 中 有 各 种 各 样 的 广播 ， 比 如 电池 的 使 用 状态 ， 电 话 的 接收 和 短信 的 接收 都 
会 产生 一 个 广播 ， 应 用 程序 开发 者 也 可 以 监听 这 些 广播 并 做 出 程序 逻辑 的 处 理 。 图 7-12 演示 了 
广播 的 运行 机 制 。 


Android 


7-12 Android 的 广播 机 制 


在 Android 系统 中 有 各 式 各 样 的 广播 ， 各 种 广播 在 Android 系统 中 运行 ， 当 “系统 /应 用 ” 
程序 运行 时 便 会 向 Android 注册 各 种 广播 。Android 接收 到 广播 后 便 会 判断 哪 种 广播 需要 哪 种 
事件 ， 然 后 向 不 同 需要 事件 的 应 用 程序 注册 事件 。 不 同 的 广播 可 能 处 理 不 同 的 事件 也 可 能 处 理 
相同 的 广播 事件 ， 这 时 就 需要 Android 系统 进行 筛选 。 例 如 在 一 个 经 典 的 电话 黑 名 单 应 用 程序 
中 ， 首 先 通过 将 黑 名 单 号 码 保存 在 数据 库 里 面 ， 当 来 电 时 ， 我 们 接收 到 来 电 广播 并 将 黑 名 单 号 
码 与 数据 库 中 的 某 个 数据 做 匹配 ， 如 果 匹 配 的 话 则 做 出 相应 的 处 理 ， 比 如 挂 掉 电话 、 比 如 静 
音 等 。 

下 面 通过 演示 代码 来 讲解 在 Android 中 如 何 编写 广播 程序 ， 代 码 中 设置 了 一 个 按钮 为 按钮 
设置 点 击 监听 通过 点 击发 送 广播 ， 在 后 台中 接收 到 广播 并 打印 LOG 信息 。 


BroadCastActivity 页 面 代码 public class BroadCastActivity extends Activity { 
public static final String ACTION INTENT TEST = "com.terry.broadcast.test"; 
/** Called when the activity is first created. */ 

GOverride 
public void onCreate(Bundle savedInstanceState) { 
super.onCreate (savedInstanceState) ; 
setContentView(R. layout .main) ; 
Button btn = (Button) findViewById(R.id.Button01) ; 
btn.setOnClickListener (new OnClickListener() { 
GOverride 
public void onClick(View v) { 
// TODO Auto-generated method stub 
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Intent intent = new Intent (ACTION INTENT TEST); 
sendBroadcast (intent); 
} 
p: 
} 
} 


接收 器 的 代码 如 下 : 


public class myBroadCast extends BroadcastReceiver { 
public myBroadCast() ( 
Log.v("BROADCAST TAG", "myBroadCast"); 
) 
GOverride 
public void onReceive(Context context, Intent intent) { 
// TODO Auto-generated method stub 
Log.v("BROADCAST TAG", "onReceive"); 
} 
} 


在 上 面 的 接收 器 中 ， 继 承 了 BroadcastReceiver， 并 重 写 了 它 的 onReceive， 并 构造 了 一 个 函 
数 。 当 单 击 一 下 按钮 ， 向 Android 发 送 了 一 个 广播 ， 如 图 7-13 所 示 。 


V 235 BROADCAST_TAG myBroadCast 
V 235 . BROADCAST TÀG onReceive 


7-13 向 Android 发 送 了 一 个 广播 


如 果 此 时 再 单 击 一 下 按钮 ， 还 是 会 再 向 Android 系统 发 送 广播 ， 此 时 日 志 信息 如 图 7-14 
所 示 。 


V 235 BROADCAST_TAG nyBroadCast 

V 235 BROADCAST TÀG onReceive 

D 60 dalvikvm threadid-17: bogus mon 14050; adjusting 
V 235 BROADCAST TÀG nyBroadCast 

V 235 BROADCAST TÀG onReceive 
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由 此 可 以 看 出 , Android 广播 的 生命 周期 并 不 像 Activity 一 样 复 杂 , 基本 过 程 如 图 7-15 所 示 。 

前 面 说 过 Android 的 广播 有 各 式 各 样 ， 那 么 Android 系统 是 如 何 帮 有 我 们 处 理 需要 哪 种 广播 
并 提供 相应 的 广播 服务 呢 ? 这 里 有 一 点 需要 大 家 注意 ， 每 实现 一 个 广播 接收 类 必须 在 应 用 程序 
中 的 manifest 中 显 式 地 注 明 哪 一 个 类 需要 广播 ， 并 为 其 设置 过 滤器 ， 如 图 7-16 所 示 。 

其 中 action 代表 一 个 要 执行 的 动作 ， 在 Andriod 中 有 很 多 种 action， 例 如 ACTION_VIEW 
和 ACTION EDIT. 

可 能 有 读者 会 问 : 如 果 在 一 个 广播 接收 器 中 要 处 理 多 个 动作 呢 ? 那 要 如 何 去 处 理 ? 在 
Android 的 接收 器 中 onReceive 已 经 为 我 们 想到 的 。 同 样 道理 , 我 们 必须 在 Intent-filter 中 注册 该 
动作 ， 可 以 是 系统 的 广播 动作 也 可 以 是 自己 需要 的 广播 ， 之 后 需要 在 onReceive 方法 中 ， 通 过 
intent.getAction0 判 断 传 进来 的 动作 ， 这 样 即 可 做 出 不 同 的 处 理 和 不 同 的 动作 。 


«Q 
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7-15 Android 广播 生命 周期 的 过 程 


package-"com.terry" 
android:versionCode-"1" 
android:versionName="1.0"> 
«application android:icon="@dravable/icon” android: label="@string/app_name"> 
“activity android:name-".BroadCastActivity" 
android: label="@string/app name"» 
<antent-filter> 
ima Sas “action android:name-"android.intent.action.MAIN" /> 
<category android:name="android. intent. category. LAUNCHER" /> 
</intent-filter> 
activity» 
“receiver android:name-".myBroadCast"» GUTEN lade 
<intent-filter > 


<action = i test"></action> 
</antent-filter> E $ : zy 
ey dss 表示 接受 广播 主 册 的 三 播 动作 ， 这 里 是 自 定 义 的 一 个 
/application> 动作 


7-16 ”需要 广播 的 类 


7.7 Dalvik 的 进程 管理 


Dalvik 虚拟 机 的 实现 离 不 开 进 程 管理 ， 其 进程 管理 特别 依赖 于 Linux. 的 进程 体系 。 例 如 要 
为 应 用 程序 创建 一 个 进程 ， 会 使 用 Linux 的 FORK 机 制 复制 一 个 进程 ， 因 为 复制 进程 的 过 程 比 
创建 进程 的 效率 要 高 。 并 且 在 Linux 中 进程 之 问 的 通信 方式 有 很 多 ， 例 如 通道 、 信 号 、 报 文 和 
共享 内 存 等 ， 这 样 对 进程 管理 将 更 加 方便 。 本 节 将 详细 讲解 Dalvik 的 进程 管理 的 基本 知识 ， 为 


读者 步 入 本 书后 面 知识 的 学 习 打 下 基础 。 


7.7.1 Zygote 


1E Android H 


启动 的 ， 而 SystemServer 进程 本 身 是 Zygote 进程 在 启动 的 过 程 中 孕育 出 来 的 。 


@> 


我 们 知道 ，Android 是 基于 Linux 内 核 的 。 而 在 Linux 中 ， 所 有 的 进程 都 是 init 进程 的 子孙 


bh， 所 有 的 应 用 程序 进程 以 及 系统 服务 进程 (SystemServer) 都 是 由 Zygote 进程 孕 
育 出 来 的 。 当 ActivityManagerService 启动 一 个 应 用 程序 时 ， 就 会 通过 Socket 与 Zygote 进程 进 
行 通信 ， 请 求 它 孕 育 出 一 个 子 进 程 来 作为 这 个 即将 要 启动 的 应 用 程序 的 进程 。 在 系统 中 有 两 个 
重要 服务 : PackageManagerService 和 ActivityManagerService， 都 是 由 SystemServer 进程 来 负责 
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进程 。 也 就 是 说 ， 所 有 的 进程 都 是 直接 或 者 间接 地 由 init 进程 孕育 出 来 的 。Zygote 进程 也 不 例 


|. 


是 在 系统 启动 的 过 程 ， 由 init 进程 创建 的 。 在 系统 启动 脚本 文件 system/core/rootdir/init.rc 
中 ， 我 们 可 以 看 到 如 下 启动 Zygote 进程 的 脚本 命令 。 


Zygote 本 身 是 一 个 应 用 层 的 程序 ， 和 驱动 、 内 核 模块 没有 任何 关系 。Zygote 的 启动 由 Linux 
的 init 启动 。 启 动 后 看 到 的 进程 名 叫 zygote， 其 最 初 的 名 字 是 app_process， 通 过 直接 调用 pctrl 
把 名 字 给 改 成 了 “zygote”。 

(1) app process.main 

这 个 函数 定义 在 文件 frameworks/base/emds/app process/App main.cpp 中 ， 其 源码 如 下 。 


int main(int argc, const char* const argv[]) 


{ 


// These are global variables in ProcessState.cpp 


mArgC - argc; 
mArgV - argv; 
mArgLen - 0; 


for (int i-0; i«argc; i++) { 
mArgLen += strlen(argv[i]) + 1; 


) 


mArgLen--; 


AppRuntime runtime; 
const char *arg; 
argv0 = argv[0]; 


// Process command line arguments 
// ignore argv[0] 

argc--; 

argves; 


// Everything up to '--' or first non '-' arg goes to the vm 
int i = runtime.addVmArguments(argc, argv); 


// Next arg is parent directory 
if (i < argc) { 
runtime.mParentDir = argv[i++]; 


} 


// Next arg is startup classname or "--zygote" 
if (i < argc) { 
arg = argv[i++]; 
if (0 == strcmp("--zygote", arg)) { 
bool startSystemServer - (i « argc) ? 
stremp(argv[i], "--start-system-server") == 0 : false; 
setArgv0(argv0, "zygote"); 
set process name ("zygote") ; 
runtime.start ("com.android.internal.os.ZygoteInit", 
startSystemServer) ; 
} else { 


«Q 
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set process name (argv0); 


runtime.mClassName - arg; 


// Remainder of args get passed to startup class main() 
runtime.mArgC - argc-i; 
runtime.mArgV = argv+i; 


LOGV("App process is starting with pid=%d, class=%s.\n", 
getpid(), runtime.getClassName()); 
runtime.start(); 
} 
} else { 
LOG ALWAYS FATAL("app process: no class name or --zygote supplied."); 
fprintf(stderr, "Error: no class name or --zygote supplied. in"); 
app usage() ; 
return 10; 


} 

这 个 函数 的 主要 作用 就 是 创建 一 个 AppRuntime 变量 ， 然 后 调用 它 的 start 成 员 函 数 。 
AppRuntime 这 个 类 在 Android 应 用 程序 进程 启动 过 程 的 源 代码 分 析 中 已 经 有 过 介绍 了 ， 它 同样 
是 在 frameworks/base/cmds/app process/app main.cpp 文件 中 定义 的 ， 以 下 是 代码 片段 。 

class AppRuntime : public AndroidRuntime 


{ 

i 

它 约 继承 于 类 AndroidRuntime， 类 AndroidRuntime 定义 在 文件 frameworks/base/core/jni/ 
AndroidRuntime.cpp 中 ， 代 码 如 下 。 


static AndroidRuntime* gCurRuntime = NULL; 


AndroidRuntime: :AndroidRuntime() 


{ 


assert (gCurRuntime == NULL); // one per process 
gCurRuntime = this; 


} 

当 AppRuntime 对 象 创 建 时 ， 会 调用 其 父 类 AndroidRuntime 的 构造 函数 ， 而 在 
AndroidRuntime 类 的 构造 函数 里 面 ， 会 将 this 指针 保存 在 静态 全 局 变量 gCurRuntime 中 ， 这 样 ， 
当 其 他 地 方 需要 使 用 这 个 AppRuntime 对 象 时 , 就 可 以 通过 同一 个 文件 中 的 这 个 函数 来 获取 这 个 
对 象 的 指针 代码 如 下 。 


AndroidRuntime* RndroidRuntime: :getRuntime() 


{ 


return gCurRuntime; 


} 


@> 
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到 上 面 的 函数 main0 中 ， 由 于 我 们 在 文件 initrc 中 设置 了 app_process 启动 参数 : --zygote 
和 --start-system-server， 因 此 ， 在 main0 函 数 里 面 ， 最 终 会 执行 下 面 语句 。 


runtime.start ("com.android.internal.os.ZygoteInit", rtSystemServer) ; 


b 


这 里 的 参数 startSystemServer 为 tue， 表 示 要 启动 SystemServer 组 件 。 由 于 AppRuntime 没 
有 实现 自己 的 start0 函 数 ， 它 继承 了 父 类 AndroidRuntime 的 start0 函 数 ， 因 此 ， 下 面 会 执行 
AndroidRuntime 类 的 start0 函 数 。 

(2) AndroidRuntime.start 

再 看 AndroidRuntime.start， 这 个 函数 定义 在 文件 frameworks/base/core/ini 中 ， 其 源码 如 下 。 


void AndroidRuntime::start(const char* className, const bool startSystemServer) 


{ 


char* slashClassName = NULL; 
char* cp; 
JNIEnv* env; 


/* start the virtual machine */ 

if (startVm(&mJavaVM, &env) !- 0) 

goto bail; 

/* 

* Register android functions. 

»/ 

if (startReg(env) < 0) { 

LOGE ("Unable to register all android natives\n"); 

goto bail; 

} 

/* 

* We want to call main() with a String array with arguments in it. 
* At present we only have one argument, the class name. Create an 
* array to hold it. 

e 

jclass stringClass; 

jobjectArray strArray; 

jstring classNameStr; 

jstring startSystemServerStr; 

stringClass - env-»FindClass("java/lang/String"); 
assert(stringClass !- NULL); 

strArray - env-»NewObjectArray(2, stringClass, NULL); 
assert(strArray !- NULL); 

classNameStr = env-»NewStringUTF (className) ; 

assert (classNameStr != NULL); 

env->SetObjectArrayElement (strArray, 0, classNameStr) ; 
startSystemServerStr = env-»NewStringUTF (startSystemServer ? 
"true" : "false"); 

env->SetObjectArrayElement (strArray, 1, startSystemServerStr) ; 
/* 

* Start VM. This thread becomes the main thread of the VM, and will 
* not return until the VM exits. 


大 
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jclass startClass; 
jmethodID startMeth; 
slashClassName = strdup (className) ; 


for (cp = slashClassName; *cp != '\0'; cp++) 
if (*cp == '.') 
top = '/'; 


startClass = env->FindClass(slashClassName) ; 
if (startClass == NULL) { 


} else { 

startMeth = env->GetStaticMethodID(startClass, "main", 
"([Ljava/lang/String;)V"); 

if (startMeth -- NULL) { 


} eise ( 
env-»CallStaticVoidMethod(startClass, startMeth, strArray); 


} 


这 个 函数 的 作用 是 启动 Android 系统 运行 时 库 , 它 主要 做 了 三 件 事情 ,一 是 调用 函数 startVM 


启动 虚拟 机 ， 二 是 调用 函数 startReg 注册 INI 方法 ， 三 是 调用 com.android.internal.os.Zygotelnit 
类 的 main0 函 数 。 


(3) Zygotelnit.main 
再 看 ZygoteInitmain， 这 个 函数 定义 在 文件 frameworks/base/core/java/com/android/internal/ 


os/ZygoteInitjava 中 ， 其 源码 如 下 。 


public class ZygoteInit { 


public static void main(String argv[]) { 
try { 


registerZygoteSocket () ; 
if (argv[1].equals("true")) ( 


startSystemServer(); 
} else if (!argv[1].equals("false")) { 


} 

if (ZYGOTE FORK MODE) { 
) eise ( 
runSelectLoopMode () ; 


} 


} catch (MethodAndArgsCaller caller) { 
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] catch (RuntimeException ex) { 


} 


上 述 函 数 主要 作 了 三 件 事情 ， 一 是 调用 registerZygoteSocket0 函 数 创建 了 一 个 socket 接口 ， 
用 来 和 ActivityManagerService 通信 ， 二 是 调用 startSystemServer0 函 数 来 启动 SystemServer 组 
件 ， 三 是 调用 runSelectLoopMode0 函 数 进入 一 个 无 限 循环 ， 在 前 面 创建 的 socket 接口 上 等 待 
ActivityManagerService 请 求 创 建新 的 应 用 程序 进程 。 

(4) Zygotelnit.registerZygoteSocket 

再 看 ZygoteInitregisterZygoteSocket， 这 个 函数 定义 在 文件 frameworks/base/core/java/com/ 
android/internal/os/ZygoteInit.java 中 ， 其 源码 如 下 。 


public class ZygoteInit { 
/[** 
* Registers a server socket for zygote command connections 
* 
* @throws RuntimeException when open fails 
E 
private static void registerZygoteSocket() { 
if (sServerSocket -- null) { 
int fileDesc; 
try { 
String env = System.getenv (ANDROID SOCKET ENV) ; 
fileDesc = Integer.parseInt (env) ; 
} catch (RuntimeException ex) { 


} 

try { 

sServerSocket = new LocalServerSocket ( 
createFileDescriptor (fileDesc)); 

} catch (IOException ex) { 


} 
} 


} 

这 个 接口 socket 是 通过 文件 描述 符 来 创建 的 ， 这 个 文件 描述 符 代表 的 就 是 前 面 说 的 
/dev/socket/zygote 文件 。 这 个 文件 的 描述 符 是 通过 环境 变量 ANDROID SOCKET ENV 得 到 的 ， 
它 的 定义 如 下 : 

public class ZygoteInit { 


private static final String ANDROID SOCKET ENV = "ANDROID SOCKET zygote"; 
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那么 这 个 环境 变量 的 值 又 是 由 谁 来 设置 的 呢 ? 我 们 知道 ， 系 统 启动 脚本 文件 
system/core/rootdir/init.re 是 由 init 进程 来 解释 执行 的 ， 而 init 进程 的 源 代码 位 于 system/core/init 
目录 中 ， 在 init.c 文件 中 ， 是 由 service start 函数 来 解释 文件 initrc 中 的 service 命令 的 。 


void service start(struct service *svc, const char *dynamic args) 


{ 
pid_t pid; 
pid = fork(); 


if (pid == 0) { 
struct socketinfo *si; 


for (si = svc->sockets; si; si = si->next) { 

int socket_type = ( 

Istrcmp(si-»type, "stream") ? SOCK STREAM : 
(!stremp(si->type, "dgram") ? SOCK DGRAM : SOCK _SEQPACKET) ) ; 
int s = create socket(si-»name, socket type, 

si->perm, si-»uid, si-»gid); 

if (s»- 0) ( 

publish socket(si-»name, s); 

} 

} 


每 一 个 service 命令 都 会 促使 init 进 程 调用 forkO 函 数 来 创建 一 个 新 的 进程 , 在 新 的 进程 里 面 ， 
会 分 析 里 面 的 socket 选项 , 对 于 每 一 个 socket 选项 , 都 会 通过 create socket 函数 来 在 /dev/socket 
目录 下 创建 一 个 文件 ， 在 这 个 场景 中 ， 这 个 文件 便 是 zygote， 然 后 得 到 的 文件 描述 符 通过 
publish socket 函数 写 入 到 环境 变量 中 。 


Static void publish socket(const char *name, int fd) 
{ 
char key[64] = ANDROID SOCKET ENV PREFIX; 
char val[64]; 
strlcpy (key + sizeof (ANDROID SOCKET ENV PREFIX) - 1, 
name, 
sizeof (key) - sizeof (ANDROID SOCKET ENV PREFIX)); 
snprintf(val, sizeof (val), "sd", fd); 
add environment (key, val); 
/* make sure we don't close-on-exec */ 
fcntl(fd, F SETFD, 0); 


} 


这 里 传 进来 的 参数 name HHA “zygote” , ifj ANDROID_SOCKET_ENV_PREFIX 在 文件 
system/core/include/cutils/sockets.h 中 的 定义 如 下 。 


view plain#define ANDROID SOCKET ENV PREFIX "ANDROID SOCKET " 


因此 ， 这 里 就 把 上 面 得 到 的 文件 描述 符 写 入 到 以 “ANDROID SOCKET zygote" Wy key 值 
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e- 


的 环境 变量 中 。 又 因为 上 面 的 ZygotelInit.registerZygoteSocket0 函 数 与 这 里 创建 socket 文件 的 
create_socket0 函 数 是 运行 在 同一 个 进程 中 ， 因 此 ， 上 面 的 ZygoteInit.registerZygoteSocket0 函 数 
可 以 直接 使 用 这 个 文件 描述 符 来 创建 一 个 Java 层 的 LocalServerSocket 对 象 。 如 果 其 他 进程 也 需 
要 打开 这 个 /dev/socket/zygote 文件 来 和 Zygote 进程 进行 通信 ， 那 就 必须 要 通过 文件 名 来 连接 这 
个 LocalServerSocket 了 ， 参 考 Android 应 用 程序 进程 启动 过 程 (4)，ActivityManagerService 是 通 
过 Process.start 函数 来 创建 一 个 新 的 进程 的 , 而 Process.start 函数 会 首先 通过 Socket 连接 到 Zygote 
进程 中 ， 最 终 由 Zygote 进程 来 完成 创建 新 的 应 用 程序 进程 ， 而 Process 类 是 通过 
openZygoteSocketIfNeeded 函数 来 连接 到 Zygote 进程 中 的 Socket 的 。 


public class Process ( 


private static void openZygoteSocketIfNeeded() 
throws ZygoteStartFailedEx { 


for (int retry - 0 

; (sZygoteSocket == null) && (retry < (retryCount + 1)) 
; retry++ ) { 

try { 

sZygoteSocket = new LocalSocket () ; 

sZygoteSocket .connect (new LocalSocketAddress (ZYGOTE SOCKET, 
LocalSocketAddress .Namespace .RESERVED) ) ; 
sZygoteInputStream 

= new DataInputStream(sZygoteSocket.getInputStream()); 
sZygoteWriter = 

new BufferedWriter ( 

new OutputStreamWriter( 

sZygoteSocket .getOutputStream()), 

256); 


} catch (IOException ex) { 


} 


} 
} 
这 里 的 ZYGOTE_SOCKET 定义 如 下 。 
public class Process { 
private static final String ZYGOTE SOCKET = "zygote"; 


它 刚好 就 是 对 应 /dev/socket 目录 下 的 zygote 文件 。 
Android 中 的 socket 机 制 和 binder 机 制 一 样 ， 都 是 可 以 用 来 进行 进程 间 通 信 。 当 Socket 对 
象 创建 完成 之 后 ， 回 到 第 三 步 中 的 ZygoteImnitmain0 函 数 中 ，startSystemServer0 函 数 来 启动 
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SystemServer 组 件 。 

(5) Zygotelnit.startSystemServer 

这 个 函数 定义 在 文件 frameworks/base/core/java/com/android/internal/os/ZygoteInit.java "P, W 
码 如 下 。 


public class ZygoteInit { 


private static boolean startSystemServer() 

throws MethodAndArgsCaller, RuntimeException { 

/* Hardcoded command line to start the system server */ 
String args[] - ( 

"--setuid-1000", 

"--setgid-1000", 


"--setgroups-1001,1002,1003,1004,1005,1006,1007,1008,1009,1010,1018,3001,3002,3003", 
"--capabilities-130104352,130104352", 
"--runtime-init", 

"--nice-name-system server", 
"com.android.server.SystemServer", 

IE 

ZygoteConnection.Arguments parsedArgs - null; 
int pid; 

try { 

parsedArgs = new ZygoteConnection.Arguments (args) ; 
/* Request to fork the system server process */ 
pid = Zygote.forkSystemServer ( 

parsedArgs.uid, parsedArgs.gid, 

parsedArgs.gids, debugFlags, null, 
parsedArgs.permittedCapabilities, 
parsedArgs.effectiveCapabilities); 

} catch (IllegalArgumentException ex) { 


} 

/* For child process */ 

if (pid == 0) { 
handleSystemServerProcess (parsedArgs) ; 


} 


return true; 


} 


} 

这 里 我 们 可 以 看 到 ，Zygote 进程 通过 Zygote.forkSystemServer0 函 数 来 创建 一 个 新 的 进程 来 
启动 SystemServer 组 件 ， 返 回 值 pid 等 于 0 的 地 方 就 是 新 的 进程 要 执行 的 路 径 ， 即 新 创建 的 进 
程 会 执行 handleSystemServerProcess 函数 。 

(6) ZygotelInit.handleSystemServerProcess 

这 个 函数 定义 在 文件 frameworks/base/core/java/com/android/internal/os/ZygotelInit.java H, iji 
码 如 下 。 


> 
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public class ZygoteInit { 


private static void handleSystemServerProcess( 
ZygoteConnection.Arguments parsedArgs) 

throws ZygoteInit.MethodAndArgsCaller ( 

closeServerSocket () ; 

/* 

* Pass the remaining arguments to SystemServer. 

* "--nice-name-system server com.android.server.SystemServer" 
加 

RuntimeInit.zygoteInit (parsedArgs.remainingArgs) ; 

/* should never reach here */ 


} 


由 于 由 Zygote 进程 创建 的 子 进程 会 继承 Zygote 进程 在 (4) 中 创建 的 Socket 文件 描述 符 ， 而 
这 里 的 子 进程 又 不 会 用 到 它 ， 因 此 ， 这 里 就 调用 closeServerSocket0 函 数 来 关闭 它 。 这 个 函数 接着 


调用 RuntimeInit.zygoteInitO 函 数 来 进一步 执行 启动 SystemServer 组 件 的 操作 。 
(7) Runtimelnit.zygoteInit 


这 个 函数 定义 在 文件 frameworks/base/core/java/com/android/internal/os/Runtimelnit java 4 


源码 如 下 。 


public class RuntimeInit { 


public static final void zygoteInit(String[] argv) 
throws ZygoteInit.MethodAndArgsCaller ( 


zygoteInitNative(); 


// Remaining arguments are passed to the start class's static main 
String startClass = argv [curArg++] ; 

String[] startArgs = new String[argv.length - curArg]; 
System.arraycopy(argv, curArg, startArgs, 0, startArgs.length); 
invokeStaticMain(startClass, startArgs); 


} 


这 个 函数 会 执行 两 个 操作 ， 一 个 是 调用 zygoteInitNativeO 函 数 来 执行 一 个 Binder 进程 间 通 
信 机 制 的 初始 化 工作 , 这 个 工作 完成 后 , 进程 中 的 Binder 对 象 就 可 以 方便 地 进行 进程 间 通信 了 ， 


另 一 个 是 调用 上 面 (5) 传 进来 的 com.android.server.SystemServer 类 的 main 函数 。 
(8) Runtimelnit.zygoteInitNative 


这 个 函数 定义 在 文件 frameworks/base/core/java/com/android/internal/os/Runtimelnit.java 4 


源码 如 下 。 


public class RuntimeInit { 


public static final native void zygoteInitNative(); 
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} 

从 这 里 可 以 看 出 ， 函 数 zygotelnitNative 是 一 个 Native) 函数 ， 实 现在 文件 
frameworks/base/core/jni/AndroidRuntime.cpp 中 。 完 成 这 一 步 后 ， 这 个 进程 的 Binder 进程 间 通 信 
机 制 基础 设施 就 准备 好 了 。 
到 (7) 中 的 RuntimeInit.zygoteInitNative() 函数 ， 下 一 步 它 就 要 执行 com.android.server. 
SystemServer 类 的 main) PR IC T o 

(9) SystemServer.main 

这 个 函数 定义 在 文件 frameworks/base/services/java/com/android/server/SystemServer.java 中 ， 


源码 如 下 。 


public class SystemServer 


{ 


native public static void initl(String[] args); 


E] 


public static void main(String[] args) { 

init1 (args) ; 

} 

public static final void init2() { 

Slog.i (TAG, "Entered the Android system server!"); 
Thread thr = new ServerThread(); 

thr.setName ("android.server.ServerThread"); 
thr.start(); 


} 
} 

这 里 的 main0 函 数 首先 会 执行 NI 方法 init], 然后 initl 会 调用 这 里 的 init20 函 数 , 在 init20 
函数 里 面 ， 会 创建 一 个 ServerThread 线程 对 象 来 执行 一 些 系 统 关键 服务 的 启动 操作 ， 例 如 在 
Android 应 用 程序 安装 过 程 源 代码 分 析 和 Android 系统 默认 Home 应 用 程序 (Launcher) 的 启动 过 程 
源 代码 分 析 中 提 到 的 PackageManagerService 和 ActivityManagerService。 

执行 完成 这 一 步骤 后 ， 层 层 返回 ， 最 后 回 到 上 面 的 3) 中 的 ZygoteInitmain0 函 数 中 ， 接 下 来 
它 就 要 调用 函数 runSelectLoopMode 进入 一 个 无 限 循 环 在 前 面 (4) 中 创建 的 接口 socket 上 等 待 
ActivityManagerService 请 求 创 建新 的 应 用 程序 进程 了 。 

(10) ZygoteInit.runSelectLoopMode 

这 个 函数 定义 在 文件 frameworks/base/core/java/com/android/internal/os/Zygotelnit.java 中 ， 源 
码 如 下 。 


public class ZygoteInit { 


private static void runSelectLoopMode() throws MethodAndArgsCaller { 
ArrayList fds - new ArrayList(); 

ArrayList peers - new ArrayList(); 

FileDescriptor[] fdArray - new FileDescriptor[4]; 
fds.add(sServerSocket.getFileDescriptor()); 

peers.add (null); 
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int loopCount = GC LOOP COUNT; 
while (true) { 
int index; 


try { 
fdArray = fds.toArray(fdArray) ; 
index = selectReadable (fdArray); 


) catch (IOException ex) { 
throw new RuntimeException("Error in select()", ex); 


if (index < 0) { 

throw new RuntimeException("Error in select()"); 
} else if (index == 0) { 

ZygoteConnection newPeer = acceptCommandPeer () ; 
peers .add(newPeer) ; 

fds .add (newPeer.getFileDesciptor()); 

} else { 

boolean done; 

done = peers.get (index) .runOnce() ; 

if (done) { 

peers. remove (index) ; 

fds . remove (index) ; 


} 
} 
} 
} 


} 

这 个 函数 用 于 等 待 ActivityManagerService 来 连接 这 个 Socket， 然 后 调用 ZygoteConnection.runOnce() 

函数 创建 新 的 应 用 程序 。 

这 样 ，Zygote 进程 就 启动 完成 了 ， 到 此 为 止 ， 读 者 对 Android 中 的 进程 已 经 有 了 一 个 深刻 

的 认识 ， 在 此 总 结 如 下 三 点 。 

O 系统 启动 时 init 进程 会 创建 Zygote VERE, Zygote 进程 负责 后 续 Android 应 用 程序 框架 
层 的 其 他 进程 的 创建 和 启动 工作 。 

O Zygote 进程 会 首先 创建 一 个 SystemServer 进程 ，SystemServer 进程 负责 启动 系统 的 关 
键 服务 ， 如 包 管 理 服务 PackageManagerService 和 应 用 程序 组 件 管理 服务 
ActivityManagerService。 

口 ” 当 我 们 需要 启动 一 个 Android 应 用 程序 时 ，ActivityManagerService 会 通过 Socket 进程 
间 通 信 机 制 ， 通 知 Zygote 进程 为 这 个 应 用 程序 创建 一 个 新 的 进程 。 


7.7.2 Dalvik 的 进程 模型 


每 一 个 Android 应 用 都 运行 在 一 个 Dalvik 虚拟 机 实例 里 ， 而 每 一 个 虚拟 机 实例 都 是 一 个 独 
立 的 进程 空间 。 虚 拟 机 的 线程 机 制 、 内 存 分 配 和 管理 、Mutex 等 都 是 依赖 底层 操作 系统 而 实现 
的 。 所 有 Android 应 用 的 线程 都 对 应 一 个 Linux 线程 , 虚拟 机 因而 可 以 更 多 的 依赖 操作 系统 的 线 
程 调度 和 管理 机 制 。 
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不 同 的 应 用 在 不 同 的 进程 空间 里 运行 ， 加 之 对 不 同 来 源 的 应 用 都 使 用 不 同 的 Linux 用 户 来 
运行 ， 可 以 最 大 程度 的 保护 应 用 的 安全 和 独立 运行 。Zygote 是 一 个 虚拟 机 进程 ， 同 时 也 是 一 个 
虚拟 机 实例 的 旷 化 器 ， 每 当 系统 要 求 执行 一 个 Android 应 用 程序 时 ，Zygote 就 会 孕育 出 一 个 子 
进程 来 执行 该 应 用 程序 。 

这 样 做 的 好 处 显而易见 : Zygote 进程 是 在 系统 启动 时 产生 的 ， 它 会 完成 虚拟 机 的 初始 化 、 
库 的 加 载 、 预 置 类 库 的 加 载 和 初始 化 等 操作 ， 而 在 系统 需要 一 个 新 的 虚拟 机 实例 时 。Zygote 通 
过 复制 自身 , 最 快速 的 提供 个 系统 。 另 外, 对 于 一 些 只 读 的 系统 库 , 所 有 虚拟 机 实例 都 和 Zygote 
共享 一 块 内 存 区 域 ， 大 大 节省 了 内 存 开销 。 

当 Zygote 进程 在 使 用 Linux 的 fork 机 制 时 有 如 下 三 种 不 同 的 方式 。 

口 fork0: 孕育 一 个 普通 的 进程 ， 该 进程 属于 Zygote 进程 。 

O forkAndSpcecialize): 孕育 一 个 特殊 的 进程 ， 该 进程 不 再 是 Zygote 进程 。 

O forkSystemServer0: 孕育 一 个 系统 服务 进程 。 

它们 之 间 的 关系 如 图 7-17 所 示 。 


forkAndSpedalize fork forkSystemServer 


7-17 fork 进程 的 关系 


Zygote 进程 可 以 再 孕育 出 其 他 进程 ， 非 Zygote 进程 则 不 能 孕育 出 其 他 进程 。 当 终止 系统 服 
务 进 城 后 ， 也 必须 终止 其 父 进 程 。 下 面 通过 源 代码 来 讲解 上 述说 法 ， 起 源码 位 于 文件 
vm\native\dalvik_system_Zygote.c 中 ， 其 中 函数 Dalvik_dalvik_system_Zygote_fork() 实 现 了 fock 
方式 ， 其 源码 如 下 。 


static void Dalvik dalvik system Zygote fork(const u4* args, JValue* pResult) 


pid t pid; 
int err; 
if (!gDvm.zygote) { 
dvmThrowException ("Ljava/lang/IllegalStateException;", 
"VM instance not started with -Xzygote") ; 
RETURN VOID(); 
} 


if (!dvmGcPreZygoteFork()) { 
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LOGE("pre-fork heap failed in"); 
dvmAbort () ; 
} 
setSignalHandler () ; 
dvmDumpLoaderStats ("zygote") ; 
pid = fork(); 
#ifdef HAVE ANDROID OS 
if (pid -- 0) { 
/* child process */ 
extern int gMallocLeakZygoteChild; 
gMallocLeakZygoteChild - 1; 
} 
#endif 
RETURN_INT (pid) ; 


} 

fork( 方 法 生成 的 子 进程 是 一 个 半 初 始 化 的 进程 ， 它 也 是 Zygote 进程 。 如 果 父 进程 之 前 已 经 
调用 过 addNewHeap， 则 不 再 调用 它 。 在 此 使 用 的 是 写 时 复制 技术 ， 所 以 Zygote 是 共享 一 个 堆 
的 。 整 个 初始 化 过 程 到 此 就 结束 了 ， 整 个 fockO 过 程 非常 简单 ， 如 图 7-18 所 示 。 


开始 


执行 过 
addNewHeap 


执行 
addNewHeap 


父 进程 子 进程 
7-18 fock() 的 流程 


而 Dalvik dalvik system Zygote _forkAndSpecialize0 实 现 了 forkAndSpcecialize() 方 式 ， 其 源 
码 如 下 。 


static pid t forkAndSpecializeCommon(const u4* args) 


{ 
pid t pid; 
uid t uid - (uid t) args[0]; 
gid t gid - (gid t) args[1]; 


ArrayObject* gids - (ArrayObject *)args[2]; 
u4 debugFlags - args[3]; 
ArrayObject *rlimits = (ArrayObject *)args [4]; 
if (!gDvm.zygote) { 
dvmThrowException ("Ljava/lang/IllegalStateException;", 
"VM instance not started with -Xzygote"); 
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return -1; 
} 
if (!dvmGcPreZygoteFork()) { 
LOGE ("pre-fork heap failed\n") ; 
dvmAbort () ; 
} 
setSignalHandler () ; 
dvmDumpLoaderStats ("zygote") ; 
pid = fork(); 
if (pid == 0) { 
int err; 
/* The child process */ 
#ifdef HAVE ANDROID OS 
extern int gMallocLeakZygoteChild; 
gMallocLeakZygoteChild - 1; 
/* keep caps across UID change, unless we're staying root */ 
if (uid != 0) { 
err = prctl(PR SET KEEPCAPS, 1, 0, 0, 0); 
if (err < 0) { 
LOGW("cannot PR_SET_KEEPCAPS errno: %d", errno) ; 
} 
} 


#endif /* HAVE ANDROID OS */ 
err - setgroupsIntarray (gids); 
if (err < 0) { 
LOGW("cannot setgroups() errno: %d", errno); 
} 


err = setrlimitsFromArray (rlimits); 
if (err < 0) { 

LOGW ("cannot setrlimit() errno: td", errno); 
} 


err = setgid(gid); 
if (err < 0) { 

LOGW("cannot setgid(%d) errno: %d", gid, errno); 
} 


err = setuid (uid); 
if (err < 0) { 
LOGW("cannot setuid(%d) errno: $d", uid, errno); 


/* 
* Our system thread ID has changed. Get the new one. 
EU 
Thread* thread - dvmThreadSelf(); 
thread->systemTid = dvmGetSysThreadId() ; 
/* configure additional debug options */ 
enableDebugFeatures (debugF lags) ; 
unsetSignalHandler () ; 
gDvm.zygote = false; 
if (!dvmInitAfterZygote()) { 
LOGE("error in post-zygote initialization\n") ; 
dvmAbort () ; 
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} eise if (pid > 0) { 

/* the parent process */ 
} 
return pid; 


} 


/* native public static int forkAndSpecialize(int uid, int gid, 

* int[] gids, int debugFlags); 

* 

static void Dalvik dalvik system Zygote forkAndSpecialize(const u4* args, 
JValue* pResult) 


{ 
pid t pid; 
pid = forkAndSpecializeCommon (args) ; 
RETURN INT (pid); 

} 


在 上 述 代 码 中 ，forkAndSpcecialize0 首 先 会 创建 它 的 子 进程 ， 该 子 进程 不 再 是 一 个 Zygote 
进程 。 整 个 过 程 如 图 7-19 所 示 。 

函数 Dalvik dalvik system Zygote forkSystemServer()9:JÀ Y forkSystemServer0 方 式 ， 其 源 
码 如 下 。 


static void Dalvik dalvik system Zygote forkSystemServer( 
const u4* args, JValue* pResult) 


pid t pid; 
pid = forkAndSpecializeCommon (args) ; 


/* The zygote process checks whether the child process has died or not. */ 
if (pid » 0) ( 
int status; 


LOGI("System server process $d has been created", pid); 
gDvm.systemServerPid - pid; 
/* There is a slight window that the system server process has crashed 
* but it went unnoticed because we haven't published its pid yet. So 
* we recheck here just to make sure that all is well. 
an 
if (waitpid(pid, &status, WNOHANG) -- pid) { 
LOGE("System server process $d has died. Restarting Zygote!", pid); 
kill(getpid(), SIGKILL); 


} 
RETURN_INT (pid) ; 


} 
当 forkSystemServerO 创 建 的 进程 被 销毁 时 , 其 父 进程 也 随 之 销毁 , 执行 流程 如 图 7-20 所 示 。 


«€ 


8 深入 理解 Android 虚拟 机 -i 


een 


开始 


kirit 
addNewHeap 
执行 过 
addNewHeap 


开始 


执行 过 
addNewHeap 
执行 
addNewHeap 


í 
父 进程 | ' 
T" i 1 
ER i | gi 
i 1 x a 
1 H Wi 
后 | ! addNewHeap 分 ! 
x! 1 p 
a a i 始 ! 
A 1 1 化 ! 
初 ! i | 启动 调试 线程 | | 
fi | | i 
wi | | 
i | waitekill( 子 进 | d 
i MUN TITAN 
! ! 有 邑 将 结 父 进程 | ! 
子 进程 子 进程 
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7.7.3 Dalvik 虚拟 机 的 进程 通信 


Linux 中 的 进程 通信 方式 有 很 多 种 ， 但 是 Dalvik 虚拟 机 使 用 了 信号 方式 来 完成 进程 之 间 的 
通信 。 也 就 是 通过 函数 sendSignal0 发 送 特定 的 信号 ， 例 如 SIGNAL-KILL、SIGNAL-QUIT 和 
SIGNAL-NALUSRI 等 ， 这 些 信 号 都 在 源码 中 进行 了 特殊 处 理 。 在 文件 vm\native\dalvik_ 
system Zygote.c 中 ,通过 函数 setSignalHandler() 和 unsetSignalHandlerO 分 别 来 设置 、 解 除 一 个 用 
来 处 理 信号 的 Handler。 这 两 个 函数 的 实现 源码 如 下 。 


static void setSignalHandler() 


{ 


int err; 
struct sigaction sa; 


memset(&sa, 0, sizeof(sa)); 
sa.sa handler - sigchldHandler; 
err - sigaction (SIGCHLD, &sa, NULL); 


if (err < 0) { 
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LOGW("Error setting SIGCHLD handler errno: %d", errno); 


} 


/* 
* Set the SIGCHLD handler back to default behavior in zygote children 
wh 

static void unsetSignalHandler() 


{ 
int err; 
struct sigaction sa; 


memset (&sa, 0, sizeof (sa) ); 
sa.sa_handler = SIG DFL; 
err = sigaction (SIGCHLD, &sa, NULL); 


if (err < 0) { 
LOGW("Error unsetting SIGCHLD handler errno: %d", errno); 
) 


} 
有 具体 的 信号 处 理工 作 是 由 函数 sigchldHandler(int s) 实 现 的 ， 其 源码 如 下 。 


static void sigchldHandler(int s) 
{ 

pid t pid; 

int status; 


while ((pid = waitpid(-1, &status, WNOHANG)) > 0) { 

/* Log process-death status that we care about. In general it is not 
safe to call LOG(...) from a signal handler because of possible 
reentrancy. However, we know a priori that the current implementation 
of LOG() is safe to call from a SIGCHLD handler in the zygote process. 
If the LOG() implementation changes its locking strategy or its use 
of syscalls within the lazy-init critical section, its use here may 
become unsafe. */ 

if (WIFEXITED(status)) { 

if (WEXITSTATUS(status)) ( 
LOG(LOG DEBUG, ZYGOTE LOG TAG, "Process $d exited cleanly (%d)\n", 
(int) pid, WEXITSTATUS (status) ) ; 
) eise ( 
IF LOGV(/*should use ZYGOTE LOG TAG*/) { 
LOG(LOG VERBOSE, ZYGOTE LOG TAG, 
"Process %d exited cleanly (%d)\n", 
(int) pid, WEXITSTATUS (status) ) ; 
} 
} 
} else if (WIFSIGNALED(status)) { 
if (WTERMSIG(status) !- SIGKILL) { 
LOG(LOG DEBUG, ZYGOTE LOG TAG, 
"Process $d terminated by signal (%d)\n", 
(int) pid, WTERMSIG(status)); 
) eise { 
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IF LOGV(/*should use ZYGOTE LOG TAG*/) [ 


} 
} 


#ifdef WCOREDUMP 


LOG(LOG VERBOSE, ZYGOTE LOG TAG, 
"Process $d terminated by signal (%d)\n", 
(int) pid, WTERMSIG(status) ) ; 


if (WCOREDUMP(status)) { 
LOG(LOG INFO, ZYGOTE LOG TAG, "Process &d dumped core\n", 


) 


#endif /* ifdef 


} 


/* 
* If the 


(int) pid); 


WCOREDUMP */ 


just-crashed process is the system server, bring down zygote 


* so that it is restarted by init and system server will be restarted 
* from there. 


eU 


if (pid = 


- gDvm.systemServerPid) [ 


LOG(LOG INFO, ZYGOTE LOG TAG, 
"Exit zygote because system server (td) has terminated\n", 
(int) pid); 

kill(getpid(), SIGKILL); 


} 
} 


if (pid < 0) 


{ 


LOG (LOG WARN, ZYGOTE LOG TAG, 
"Zygote SIGCHLD error (td) in waitpid\n",errno) ; 


} 
} 


在 上 述 函 数 中 


， 通 过 一 个 循环 根据 不 同 的 状态 打印 不 同 的 日 志 ， 通 过 “pid 一 


gDvm.systemServerPid” 判 断 是 否 是 系统 服务 进程 ， 如 果 是 则 销毁 其 父 进程 。 
如 果 启 动 虚拟 机 时 ， 没 有 加 上 参数 “-Xrs” 和 “-Xnoqutihandler”， 则 在 创建 非 Zygote 进程 
时 会 触发 一 个 线程 运行 signalCatcherThreadStartO 函 数 。 这 个 线程 的 功能 就 是 在 一 个 无 限 循环 中 


不 断 的 监听 连 个 信号 
表 的 信息 。 当 接收 型 


: SIGQUIT 和 SIGUSR1。 当 SIGQUIT 被 捕获 时 ， 就 会 打印 JNI 全 局 参考 


SIGUSR1 信号 时 ， 会 强制 进行 不 回收 软 引 用 的 垃圾 收集 。 这 时 挡 在 程序 中 


向 进程 发 送 SIGUSRI 信号 时 ， 就 可 以 使 进程 不 回收 引用 的 垃圾 收集 ， 上 有 具体 实现 是 在 文件 
vm\SignalCatcher.c 中 被 dvmSignalCatcherStartup 调用 的 ， 其 源码 如 下 。 


/* 


* Sleep in sigwait() until a signal arrives. 


x) 


static void* signalCatcherThreadStart (void* arg) 


{ 


Thread* self = dvmThreadSelf(); 
sigset t mask; 


int cc; 
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UNUSED PARAMETER (arg); 
LOGV("Signal catcher thread started (threadid=%d)\n", self-»threadId); 


/* set up mask with signals we want to handle */ 
sigemptyset (&mask) ; 
sigaddset (&mask, SIGQUIT) ; 
sigaddset (&mask, SIGUSR1) ; 

#if defined(WITH JIT) && defined(WITH JIT TUNING) 
sigaddset (&mask, SIGUSR2); 

#endif 


while (true) { 
int rcvd; 


dvmChangeStatus (self, THREAD VMWAIT); 


Signals for sigwait() must be blocked but not ignored. We 
block signals like SIGQUIT for all threads, so the condition 
is met. When the signal hits, we wake up, without any signal 
handlers being invoked. 


traverse their stacks. 


* 
* 
* 
* 
* 
* We want to suspend all other threads, so that it's safe to 
* 
* 
* When running under GDB we occasionally return with EINTR (e.g. 
* when other threads exit). 
loop: 
cc = sigwait(&mask, &rcvd); 
if (ce I= 0) { 
if (cc == EINTR) { 
//LOGV("sigwait: EINTR\n") ; 
goto loop; 
} 
assert (!"bad result from sigwait") ; 


} 


if (!gDvm.haltSignalCatcher) { 
LOGI ("threadid=%d: reacting to signal %d\n", 
dvmThreadSelf ()->threadId, rcvd); 


} 


/* set our status to RUNNING, self-suspending if GC in progress */ 
dvmChangeStatus (self, THREAD RUNNING); 


if (gDvm.haltSignalCatcher) 
break; 


if (rcvd -- SIGQUIT) ( 
dvmSuspendAllThreads (SUSPEND FOR STACK DUMP); 
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dvmDumpLoaderStats ("sig"); 
logThreadStacks(); 


#if defined(WITH JIT) && defined(WITH JIT TUNING) 


dvmCompilerDumpStats (); 
#endif 


if (false) { 
dvmLockMutex (&gDvm. jniGlobalRefLock) ; 
//dvmDumpReferenceTable (&gDvm.jniGlobalRefTable, "JNI global"); 
dvmUnlockMutex (&gDvm. jniGlobalRefLock); 


) 


/ /dvmDumpTrackedAllocations (true); 
dvmResumeAllThreads (SUSPEND FOR STACK DUMP); 
} else if (rcvd == SIGUSR1) { 
#if WITH HPROF 
LOGI("SIGUSR1 forcing GC and HPROF dump\n") ; 


hprofDumpHeap (NULL) ; 

#else 
LOGI("SIGUSR1 forcing GC (no HPROF)\n") ; 
dvmCollectGarbage (false); 

#endif 


#if defined (WITH JIT) && defined(WITH JIT TUNING) 
} else if (rcvd == SIGUSR2) { 
gDvmJit.printMe ^- true; 
dvmCompilerDumpStats () ; 
/* Stress-test unchain all */ 


dvmJitUnchainAll(); 
#endif 
} else { 
LOGE ("unexpected signal %d\n", rcvd); 
} 
} 
return NULL; 
} 
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内 存 分 配 是 一 款 虚拟 机 产品 的 核心 内 容 ， 良 好 的 内 存 分 配 策略 可 以 提高 虚拟 机 的 处 理 效率 。 
Dalvik 虚拟 机 的 内 容 分 配 策略 和 Java 虚拟 机 的 内 存 分 配 策略 类 似 。 本 章 将 详细 讲解 Java 虚拟 机 
和 Dalvik 虚拟 机 中 内 存 分 配 策略 的 基本 知识 ， 为 读者 步 入 本 书后 面 知识 的 学 习 打下 基础 。 


8.1 Java 的 内 存 分 配 管理 


Java 内 存 分 配 与 管理 是 Java 的 核心 技术 之 一 ， 一 般 来 说 ，Java 在 内 存 分 配 时 会 涉及 到 以 


下 区 域 。 


口 
口 
口 
口 
口 
口 
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寄存 器 : 我 们 在 程序 中 无 法 控制 。 

Be: 存放 基本 类 型 的 数据 和 对 象 的 引用 ， 但 对 象 本 身 不 存放 在 栈 中 ， 而 是 存放 在 堆 中 。 
ME: 存放 用 new 产生 的 数据 。 

HER: 存放 在 对 象 中 用 static 定义 的 静态 成 员 。 

常量 池 : 存放 常量 。 

非 RAM 存储 : 硬盘 等 永久 存储 空间 。 


内 存 分 配 中 的 栈 和 堆 


1. 栈 


在 函数 中 定义 的 一 些 基本 类 型 的 变量 数据 ， 还 有 对 象 的 引用 变量 都 在 
当 在 一 段 代码 块 中 定义 一 个 : 量 时 ， Java 就 在 栈 中 
作用 域 后 ，Java & Hz 
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Fl, JEJE SUB, A 方法 又 调用 了 B 方法 ， 于 是 产生 栈 帧 F2 也 被 压 入 栈 ， 执行 完毕 后 ， 先 
弹出 F2 栈 帧 ， 再 弹出 Fl 栈 帧 ， 遵 循 “先进 后 出 ”原则 。 

栈 帧 中 到 底 存在 着 什么 数据 呢 ? 在 栈 帧 中 主要 保存 如 下 3 类 数据 。 

口 本 地 变量 (Local Variables): 包括 输入 参数 和 输出 参数 以 及 方法 内 的 变量 。 

口 ” 栈 操作 (Operand Stack): 记录 出 栈 、 入 栈 的 操作 。 

口 “” 栈 帧 数据 (Frame Data): 包括 类 文件 、 方 法 等 。 

Java 栈 如 图 8-1 所 示 。 


Java Stack 
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8-1 Java 栈 


图 8-1 中 ， 在 一 个 栈 中 有 两 个 栈 帧 ， 栈 帧 2 是 最 先 被 调用 的 方法 ， 先 入 栈 ， 然 后 方法 2 又 
调用 了 方法 1, 栈 帧 1 处 于 栈 项 的 位 置 , Beli 2 处 于 栈 底 , 执行 完毕 后 , 依次 弹出 栈 帧 1 和 栈 帧 2， 
2. HE 


堆 内 存 用 来 存放 由 关键 字 new 创建 的 对 象 和 数组 。 在 堆 中 分 配 的 内 存 ， 由 Java 虚拟 机 的 自 
动 垃圾 回收 器 来 管理 。 

在 堆 中 产生 了 一 个 数组 或 对 象 后 ， 还 可 以 在 栈 中 定义 一 个 特殊 的 变量 ， 让 栈 中 这 个 变量 的 
取 值 等 于 数组 或 对 象 在 堆 内 存 中 的 首 地 址 ， 栈 中 的 这 个 变量 就 成 了 数组 或 对 象 的 引用 变量 。 引 
用 变量 就 相当 于 是 为 数组 或 对 象 起 的 一 个 名 称 ， 以 后 就 可 以 在 程序 中 使 用 栈 中 的 引用 变量 来 访 
问 堆 中 的 数组 或 对 象 。 

引用 变量 是 普通 的 变量 ， 定 义 时 在 栈 中 分 配 ， 引 用 变量 在 程序 运行 到 其 作用 域 之 外 后 被 释 
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放 。 而 数组 和 对 象 本 身 在 堆 中 分 配 ， 即 使 程序 运行 到 使 用 new 产生 数组 或 者 对 象 的 语句 所 在 的 
代码 块 之 外 ， 数 组 和 对 象 本 身 占 据 的 内 存 不 会 被 释放 ， 数 组 和 对 象 在 没有 引用 变量 指向 它 时 ， 
才 变 为 垃圾 ， 不 能 再 被 使 用 ， 但 仍然 占据 内 存 空 间 不 放 ， 在 随后 的 一 个 不 确定 的 时 间 被 垃圾 回 
收 器 收 走 (释放 掉 )。 这 也 是 Java 比较 占 内 存 的 原因 。 

实际 上 ， 栈 中 的 变量 指向 堆 内 存 中 的 变量 ， 这 就 是 Java 中 的 指针 。 


3. 常量 池 (constant pool) 


常量 池 指 的 是 在 编译 期 被 确定 ， 并 被 保存 在 已 编译 的 .class 文件 中 的 一 些 数据 。 除 了 包含 代 
码 中 所 定义 的 各 种 基本 类 型 (如 int. long 等 ) 和 对 象 型 (如 String 及 数组 ) 的 常量 值 (final) 还 包含 一 
些 以 文本 形式 出 现 的 符号 引用 。 

O 类 和 接口 的 全 限定 名 。 

O 字段 的 名 称 和 描述 符 。 

口 方法 和 名 称 和 描述 符 。 

虚拟 机 必须 为 每 个 被 装载 的 类 型 维护 一 个 常量 池 。 常 量 池 就 是 该 类 型 所 用 到 常量 的 一 个 有 
序 集 和 ， 包 括 直 接 常量 (string,integer 和 floating point 常量 ) 和 对 其 他 类 型 ， 字 段 和 方法 的 符号 
引用 。 

对 于 Sting 常量 ， 它 的 值 是 在 常量 池 中 的 。 而 Java 虚拟 机 中 的 常量 池 在 内 存 当 中 是 以 表 的 
形式 存在 的 ， 对 于 String 类 型 ， 有 一 张 固定 长 度 的 CONSTANT String info 表 用 来 存储 文字 字 
符 串 值 ， 但 是 该 表 只 存储 文字 字符 串 值 ， 并 不 存储 符号 引用 。 在 程序 执行 时 ， 常 量 池 会 储存 在 
Method Area( 方 法 区 域 ) 中 ， 而 不 是 堆 中 。 

一 个 Java 虚拟 机 实例 只 存在 一 个 堆 类 存 ， 堆 内 存 的 大 小 是 可 以 调节 的 。 类 加 载 器 读 取 了 类 
文件 后 ， 需 要 把 类 、 方 法 、 常 变量 放 到 堆 内 存 中 ， 以 方便 执行 器 执行 ， 堆 内 存 分 为 三 部 分 。 

(1) Permanent Space 永久 存储 区 

永久 存储 区 是 一 个 常 驻 内 存 区 域 , 用 于 存放 JDK 自身 所 携带 的 Class Interface 的 元 数据 。 也 
就 是 说 ， 它 存储 的 是 运行 环境 必需 的 类 信息 ， 被 装载 进 此 区 域 的 数据 是 不 会 被 垃圾 回收 器 回收 
掉 的 ， 关 闭 Java 虚拟 机 才 会 释放 此 区 域 所 占用 的 内 存 。 

(2) Young Generation Space 新 生 区 

新 生 区 是 类 的 诞生 、 成 长 、 消 亡 的 区 域 ， 一 个 类 在 这 里 产生 、 应 用 ， 最 后 被 垃圾 回收 器 
集 ， 结 束 生 命 。 新 生 区 又 分 为 两 部 分 : 伊 甸 区 (Eden space) 和 幸存 者 区 (Survivor pace), HA K 
都 是 在 伊 甸 区 被 new( 新 建 ) 出 来 的 .幸存 区 有 两 个 :0 [X (Survivor 0 space) 和 1 [X (Survivor 1 space 
当 伊甸园 的 空间 用 完 时 ， 程 序 又 需要 创建 对 象 ，Java 虚拟 机 的 垃圾 回收 器 将 对 伊甸园 区 进行 
圾 回收 ， 将 伊甸园 区 中 的 不 再 被 其 他 对 象 所 引用 的 对 象 进行 销毁 。 然 后 将 伊甸园 中 的 剩余 对 象 
移动 到 幸存 0 区 。 若 幸存 0 区 也 满 了 ， 再 对 该 区 进行 垃圾 回收 ， 然 后 移动 到 1 区 。 那 如 果 1 区 
也 满 了 呢 ? 再 移动 到 养老 区 。 

(3) Tenure generation space 养老 区 

养老 区 用 于 保存 从 新 生 区 筛选 出 来 的 Java 对 象 ， 一 般 池 对 象 都 在 这 个 区 域 活跃 。 

上 述 三 个 区 的 示意 图 如 图 8-2 所 示 。 
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82 ” 堆 内 存 的 三 个 区 


注意 : 为 什么 要 把 Java 虚拟 机 堆 和 Java 虚拟 机 栈 区 分 出 来 呢 ? Java 虚拟 机 栈 中 不 是 也 可 以 存储 


数据 吗 ? 

(1) 从 软件 设计 的 角度 看 , Java 虚拟 机 栈 代表 了 处 理 逻 辑 , 而 Java 虚拟 机 堆 代表 了 数据 。 
这 样 分 开 ， 使 得 处 理 远 辑 更 为 清晰 。 分 而 治之 的 思想 。 这 种 隔离 、 模 块 化 的 思想 在 软件 
设计 的 方方面面 都 有 体现 。 

(2) Java 虚拟 机 扒 与 Java 虚拟 机 栈 的 分 离 , 使 得 Java 虚拟 机 堆 中 的 内 容 可 以 被 多 个 Java 
虚拟 机 栈 共 享 (也 可 以 理解 为 多 个 线程 访问 同一 个 对 象 )。 这 种 共享 的 收益 是 很 多 的 。 一方 
面 这 种 共享 提供 了 一 种 有 效 的 数据 交互 方式 (如 : 共享 内 存 )， 另 一 方面 ，Java 虚拟 机 堆 中 
的 共享 常量 和 缓存 可 以 被 所 有 Java 虚拟 机 栈 访 问 ， 节 省 了 空间 。 

(3) Java 虚拟 机 栈 因为 运行 时 的 需要 ， 比 如 保存 系统 运行 的 上 下 文 ， 需 要 进行 地 址 段 的 
划分 。 由 于 Java 虚拟 机 栈 只 能 向 上 增长 , 因此 就 会 限制 住 Java 虚拟 机 栈 存储 内 容 的 能 力 。 
而 Java 虚拟 机 堆 不 同 ，Java 虚拟 机 堆 中 的 对 象 是 可 以 根据 需要 动态 增长 的 ， 因 此 Java È 
拟 机 栈 和 Java 虚拟 机 堆 的 拆 分 ,使 得 动态 增长 成 为 可 能 ， 相 应 Java 虚拟 机 栈 中 只 需 记录 
Java 虚拟 机 堆 中 的 一 个 地 址 即 可 。 

(4) 面向 对 象 就 是 Java 虚拟 机 堆 和 Java 虚拟 机 栈 的 完美 结合 。 其实, 面向 对 象 方式 的 程 
序 与 以 前 结构 化 的 程序 在 执行 上 没有 任何 区 别 。 但是， 面向 对 象 的 引入 ， 使 得 对 待 问题 
的 思考 方式 发 生 了 改变 ， 而 更 接近 于 自然 方式 的 思考 。 当 我 们 把 对 象 拆 开 ， 你 会 发 现 ， 
对 象 的 属性 其 实 就 是 数据 ， 存 放 在 Java 虚拟 机 堆 中 ; MRA AK), WRT 
辑 ， 放 在 Java 虚拟 机 栈 中 。 我 们 在 编写 对 象 的 时 候 ， 其 实 即 编写 了 数据 结构 ， 也 编写 的 


处 理 数 据 的 逻辑 。 不 得 不 承认 ， 面 向 对 象 的 设计 ， 确 实 很 美 。 


8.12 ” 堆 和 栈 的 合作 


Java 的 堆 是 一 个 运行 时 数据 区 ， 类 的 对 象 从 中 分 配 空间 。 这 些 对 象 通过 new、newarray、 
anewarray 和 multianewarray 等 指令 建立 ， 它 们 不 需要 程序 代码 来 显 式 的 释放 。 堆 是 由 垃圾 回收 
来 负责 的 ， 堆 的 优势 是 可 以 动态 地 分 配 内 存 大 小 ， 生 存 期 也 不 必 事 先 告诉 编译 器 ， 因 为 它 是 在 
运行 时 动态 分 配 内 存 的 ，Java 的 垃圾 收集 器 会 自动 收 走 这 些 不 再 使 用 的 数据 。 但 缺点 是 ， 由 于 
要 在 运行 时 动态 分 配 内 存 ， 存 取 速 度 较 慢 。 

栈 的 优势 是 存 取 速 度 比 堆 要 快 ， 仅 次 于 寄存 器 ， 栈 数据 可 以 共享 。 但 其 缺点 是 ， 存 在 栈 中 
的 数据 大 小 与 生存 期 必须 是 确定 的 ， 缺 乏 灵活 性 。 栈 中 主要 存放 一 些 基本 类 型 的 变量 数据 (int, 
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short, long, byte, float, double, boolean, char) 和 对 象 句柄 (引用 )。 

栈 有 一 个 很 重要 的 特殊 性 ， 就 是 存在 栈 中 的 数据 可 以 共享 。 假 设 我 们 同时 定义 : 

int a = 3; 

int b = 3; 

编译 器 先 处 理 inta=3; 首先 它 会 在 栈 中 创建 一 个 变量 为 a 的 引用 ， 然 后 查找 栈 中 是 否 有 3 
这 个 值 ， 如 果 没 找到 ， 就 将 3 存放 进来 ， 然 后 将 a 指向 3。 接 着 处 理 intb = 3; 在 创建 完 b 的 引 
用 变量 后 ， 因 为 在 栈 中 已 经 有 3 这 个 值 ， 便 将 b 直接 指向 3。 这 样 ， 就 出 现 了 a 与 b 同时 均 指 向 
3 的 情况 。 如 果 这 时 再 令 a=4; 那么 编译 器 会 重新 搜索 栈 中 是 否 有 4 值 ， 如 果 没 有 ， 则 将 4 存放 
进来 ， 并 令 a 指向 4; 如 果 已 经 有 了 ， 则 直接 将 a 指向 这 个 地 址 。 因 此 a 值 的 改变 不 会 影响 到 
b 的 值 。 

要 注意 这 种 数据 的 共享 与 两 个 对 象 的 引用 同时 指向 一 个 对 象 的 这 种 共享 是 不 同 的 ， 因 为 这 
种 情况 a 的 修改 并 不 会 影响 到 b， 它 是 由 编译 器 完成 的 ， 有 利于 节省 空间 。 而 一 个 对 象 引 用 变量 
修改 了 这 个 对 象 的 内 部 状态 ， 会 影响 到 另 一 个 对 象 引 用 变量 。 

在 Java 中 ，String 是 一 个 特殊 的 包装 类 数据 。 可 以 用 如 下 两 种 的 形式 来 创建 。 

String str = new String("abc"); 
String str - "abc"; 

其 中 第 一 种 是 用 new0 来 新 建 对 象 的 ， 它 会 在 存放 于 堆 中 。 每 调用 一 次 就 会 创建 一 个 新 的 对 
象 。 而 第 二 种 是 先 在 栈 中 创建 一 个 对 String 类 的 对 象 引用 变量 str， 然 后 通过 符号 引用 去 字符 串 
常量 池 里 找 有 没有 “abc”,， 如 果 没有 ,， 则 将 “abc” 存 放 进 字符 串 常量 地， 并 令 str 指向 “abc”， 
如 果 已 经 有 “abc” 则 直接 令 str 指向 “abc”。 

比较 类 里 面 的 数值 是 否 相等 时 使 用 equals 771; 当 测 试 两 个 包装 类 的 引用 是 否 指向 同一 个 
对 象 时 ， 用 = =， 下 面 用 例子 说 明 上 面 的 理论 。 

String strl = "abc"; 
String str2 = "abc"; 
System.out.println(strl--str2); //true 

由 此 可 以 看 出 strl 和 str2 是 指向 同一 个 对 象 的 。 
String strl -new String ("abc"); 
String str2 -new String ("abc"); 
System.out.println(strl--str2); // false 

Hl new 的 方式 的 功能 是 生成 不 同 的 对 象 ,每 一 次 生成 一 个 .因此 用 第 二 种 方式 创建 多 个 “abc” 
字符 串 ， 在 内 存 中 其 实 只 存在 一 个 对 象 而 已 。 这 种 写法 有 利于 节省 内 存 空 间 ， 同 时 它 可 以 在 一 
定 程度 上 提高 程序 的 运行 速度 ， 因 为 Java 虚拟 机 会 自动 根据 栈 中 数据 的 实际 情况 来 决定 是 否 有 
必要 创建 新 对 象 。 而 对 于 代码 “String str = new String("abc"):”， 则 一 概 在 堆 中 创建 新 对 象 ， 而 
不 管 其 字符 串 值 是 否 相等 ， 是 否 有 必要 创建 新 对 象 ， 从 而 加 重 了 程序 的 负担 。 

另 一 方面 ， 要 注意 在 使 用 诸如 “String str = "abc":” 的 格式 定义 类 时 ， 总 是 想当然 地 认为 ， 
创建 了 String 类 的 对 象 sr。 此 时 会 担心 对 象 可 能 并 没有 被 创建 ， 而 可 能 只 是 指向 一 个 先前 已 经 
创建 的 对 象 。 只 有 通过 方法 new0 才 能 保证 每 次 都 创建 一 个 新 的 对 象 。 

由 于 String 类 的 immutable 性 质 ， 当 String 变量 需要 经 常 变换 其 值 时 ， 应 该 考虑 使 用 
StringBuffer 类 以 提高 程序 效率 。 因 为 String 不 属于 8 种 基本 数据 类 型 ，String 是 一 个 对 象 。 所 
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以 对 象 的 默认 值 是 null， 所 以 String 的 默认 值 也 是 null; 但 它 又 是 一 种 特殊 的 对 象 ， 有 其 他 对 象 
没有 的 一 些 特性 。 由 此 可 见 ，new String()#il new String(“”) 都 是 申明 一 个 新 的 空 字符 串 ， 是 空 
串 不 是 null。 

请 看 下 面 的 代码 : 

String s0="kvill"; 

String sl="kvill"; 

String s2-"kv" + "ill"; 
System.out.println( s0--s1 ); 
System.out.println( s0--s2 ); 
运行 结果 如 下 。 

true true 


Java 会 确保 一 个 字符 串 常量 只 有 一 个 复 本 。 因 为 上 述 例子 中 的 so 和 sl 中 的 “kvil” 都 是 
字符 串 常量 ， 它 们 在 编译 期 就 被 确定 了 ， 所 以 s0==sl 为 true; ifj "kv" Al "ill" UE RR 
常量 ， 当 一 个 字符 串 由 多 个 字符 串 常量 连接 而 成 时 ， 它 自己 肯定 也 是 字符 串 常量 ， 所 以 s2 也 同 
样 在 编译 期 就 被 解析 为 一 个 字符 串 常量 ， 所 以 s2 也 是 常量 池 中 “kvill” 的 一 个 引用 。 所 以 我 们 
得 出 s0 一 s1 一 s2; 用 new String) 创建 的 字符 串 不 是 常量 ,不 能 在 编译 期 就 确定 ,所 以 new String) 
创建 的 字符 串 不 放 入 常量 池 中 ， 它 们 有 自己 的 地 址 空间 。 

再 看 下 面 的 代码 : 

String s0-"kvill"; 

String sl=new String("kvill"); 

String s2-"kv" « new String("ill"); 

System.out.println( s0==s1 ); 

System.out.println( s0--s2 ); 

System.out.println( s1--s2 ); 

运行 结果 如 下 。 

false false false 

在 上 述 代码 中 ，s0 还 是 常量 池 中 “kvil” 的 应 用 ，s1 因为 无 法 在 编译 期 确定 ， 所 以 是 运行 
时 创建 的 新 对 象 “kvill” 的 引用 ，s2 因为 有 后 半 部 分 new String(“ 壕 ”) 所 以 也 无 法 在 编译 期 确 
定 ， 所 以 也 是 一 个 新 创建 对 象 “kvil” 的 应 用 ， 明 白 了 这 些 也 就 知道 为 何 会 得 出 此 结果 了 。 

另外 ， 存 在 于 .class 文件 中 的 常量 池 ， 在 运行 时 被 Java 虚拟 机 装载 ， 并 且 可 以 扩充 。String 
的 intern( 方 法 就 是 扩充 常量 池 的 一 个 方法 ; 当 一 个 String 实例 str 调用 intern0 方 法 时 ，Java ft 
找 常 量 池 中 是 否 有 相同 Unicode 的 字符 串 常量 ， 如 果 有 则 返回 其 的 引用 ， 如 果 没 有 则 在 常量 池 
中 增加 一 个 Unicode 等 于 str 的 字符 串 并 返回 它 的 引用 。 请 看 下 面 的 演示 示例 。 

String s0- "kvill"; 

String sl=new String("kvill"); 

String s2-new String("kvill"); 

System.out.println( s0--s1 ); 

System.out.println( "*xexeeeekkm ); 

g1.intern() ; 


s2=s2.intern(); // 把 常量 池 中 "kvil1" 的 引用 赋 给 s2 


System.out.println( s0--s1); 
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System.out.println( s0--sl.intern() ); 

System.out.println( s0--s2 ); 

运行 结果 如 下 。 

false false // 虽 然 执 行 了 s1.intern() ,但 它 的 返回 值 没有 赋 给 s1 

true // 说 明 s1.intern () 返回 的 是 常量 池 中 "kvil1" 的 引用 true 

另外 ,很 多 人 认为 使 用 String.intern( 方 法 可 以 将 一 个 String 类 保存 到 一 个 全 局 String 表 中 ， 
如 果 具 有 相同 值 的 Unicode 字符 串 已 经 在 这 个 表 中 ， 那 么 该 方法 返回 表 中 己 有 字符 串 的 地 址 ， 
如 果 在 表 中 没有 相同 值 的 字符 串 ， 则 将 自己 的 地 址 注册 到 表 中 是 错 的 。 也 就 是 说 如 果 将 这 个 全 
局 的 Suing 表 理解 为 常量 池 的 话 ， 如 果 在 表 中 没有 相同 值 的 字符 串 ， 则 不 能 将 自己 的 地 址 注册 
到 表 中 。 请 看 下 面 的 演示 示例 。 

String sl=new String("kvill"); 

String s2=sl.intern(); 

System.out.println( sl==sl.intern() ); 

System.out.println( sl+" "+s2 ); 

System.out.println( s2==sl.intern() ); 

运行 结果 如 下 。 

false kvill kvill true 

在 这 个 类 中 我 们 没有 声名 一 个 “kvill ”常量 ， 所 以 常量 池 中 一 开始 是 没有 “kvil” 的 ， 当 我 
们 调用 sl.internO 后 就 在 常量 池 中 新 添加 了 一 个 “kvill” 常 量 ， 原 来 的 不 在 常量 池 中 的 “kvill” 
仍然 存在 ， 也 就 不 是 “将 自己 的 地 址 注册 到 常量 池 中 ”了 。 

sl= =sl.internO 为 false 说 明 原 来 的 “kvill” 仍 然 存 在 ; s2 现在 为 常量 池 中 “kvil” 的 地 址 ， 
所 以 有 s2==s1.intern() true. 

通过 使 用 equals0，String 可 以 比较 两 字符 串 的 Unicode 序列 是 否 相 当 ， 如 果 相 等 返回 true. 
而 “==” 是 比较 两 字符 串 的 地 址 是 否 相 同 ， 也 就 是 是 否 是 同一 个 字符 串 的 引用 。 

String 的 实例 一 旦 生成 就 不 会 再 改变 了 ， 比 如 下 面 的 语句 。 


String str="kv"+"ill"+" "+"ans"; 


LGR str 有 4 个 字符 串 常 量 ， 首 先 “kv” 和 “ 记 ” 生 成 了 “kvill” 存 在 内 存 中 ， 然 后 “kvill” 
又 和 “ ” 生成 “kvil” 存 在 内 存 中 ， 最 后 又 和 生成 了 “kvill ans”。 并 把 这 个 字符 串 的 地 址 赋 
给 了 str, 就 是 因为 String 的 “不 可 变 ” 产 生 了 很 多 临时 变量 , 这 也 就 是 为 什么 建议 用 StringBuffer 
的 原因 了 ， 因 为 StringBuffer 是 可 改变 的 。 


82 运行 时 的 数据 区 域 


Java 通过 自身 的 动态 内 存 分 配 和 垃圾 回收 机 制 ， 可 以 使 Java 程序 员 不 用 像 C++ 程序 员 那 么 
头疼 内 存 的 分 配 与 回收 。 对 于 这 一 点 来 说 , 相信 熟悉 COM 机 制 的 读者 对 于 引用 计数 管理 内 存 的 
方式 深 有 感触 。 通 过 Java 虚拟 机 的 自动 内 存 管理 机 制 ， 不 仅 降低 了 编码 的 难度 ， 而 且 不 容易 出 
现 内 存 泄漏 和 内 存 溢出 的 问题 。 但 是 这 过 于 理想 的 愿望 正 是 由 于 把 内 存 的 控制 权 交 给 了 Java 虚 
拟 机 ， 一 旦 出 现 内 存 泄漏 和 溢出 ， 我 们 就 必须 翻 过 Java 虚拟 机 自动 内 存 管理 这 堵 高 墙 去 排查 错 
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误 。 所 以 在 本 节 的 内 容 中 , 将 详细 讲解 JVM 运行 时 数据 区 域 的 划分 、 作 用 以 及 可 能 出 现 的 异常 。 

根据 《Java 虚拟 机 规范 》 的 规定 ，Java 虚拟 机 在 执行 Java 程序 时 ， 即 运行 时 环境 下 会 把 其 
所 管理 的 内 存 划分 为 几 个 不 同 的 数据 区 域 。 有 的 区 域 伴随 虚拟 机 进程 的 启动 而 创建 ， 死 亡 而 销 
毁 ， 有 些 区 域 则 是 依赖 用 户 线程 的 启动 时 创建 ， 结 束 时 销毁 。 所 有 线程 共享 方法 区 和 堆 ， 虚 拟 
机 栈 、 本 地 方法 栈 和 程序 计数 器 是 线程 隔离 的 数据 区 。Java 虚拟 机 运行 时 的 数据 区 结构 如 图 8-3 
所 示 。 


运行 时 数据 区 


方法 区 
Ei 


8-3 Java 虚拟 机 运行 时 的 数据 区 结构 


Java 虚拟 机 内 存 模型 中 定义 的 访问 操作 与 物理 计算 机 处 理 的 基本 一 致 。Java 通过 多 线程 机 
制 使 得 多 个 任务 同时 执行 处 理 ， 所 有 的 线程 共享 Java 虚拟 机 内 存 区 域 main memory， 而 每 个 线 
程 又 单独 的 有 自己 的 工作 内 存 ， 当 线程 与 内 存 区 域 进行 交互 时 ， 数 据 从 主 存 复制 到 工作 内 存 ， 
进而 交 由 线程 处 理 (操作 码 + 操 作 数 )。 


8.2.1 程序 计数 器 (Program Counter Register) 


在 Java 应 用 中 ， 程 序 计数 器 是 一 块 较 小 的 内 存 空间 ， 其 作用 相当 于 当前 线程 所 执行 的 字 节 
码 的 行 号 指示 器 。 在 Java 虚拟 机 的 概念 模型 里 ， 字 节 码 解释 器 通过 改变 这 个 计数 器 的 值 来 选取 
下 一 条 需要 执行 的 字 节 码 指令 ， 很 多 基础 功能 都 需要 依赖 这 个 计数 器 来 完成 。 例 如 分 支 、 循 环 、 
跳 转 、 异 常 处 理 、 线 程 恢 复 等 。 

由 于 在 Java 虚拟 机 的 多 线程 应 用 中 ， 是 通过 线程 轮流 切换 并 分 配 处 理 器 执行 时 间 的 方式 来 
实现 的 , 所 以 在 任何 一 个 确定 的 时 刻 的 处 理 器 (对 于 多 核 处 理 器 来 说 是 一 个 内 核 )， 只 会 执行 一 条 
线程 中 的 指令 。 为 了 在 线程 切换 后 能 恢复 到 正确 的 执行 位 置 ， 每 条 线程 都 需要 有 一 个 独立 的 程 
序 计 数 器 ， 并 且 各 条 线程 之 间 的 计数 器 互 不 影响 ， 能 够 独立 存储 ， 我 们 称 这 类 内 存 区 域 为 “ 线 
HAA” WAF. 

如 果 线 程 正在 执行 的 是 一 个 Java 方法 ， 这 个 计数 器 记录 的 是 正在 执行 的 虚拟 机 字 节 码 指令 
的 地 址 。 如 果 正 在 执行 的 是 Native( 本 地 ) 方 法 ， 那 么 这 个 计数 器 值 为 空 (Undefined)。 此 内 存 区 域 
是 唯一 一 个 在 Java 虚拟 机 规范 中 没有 规定 任何 OutOfMemoryError 情况 的 区 域 。 

因为 操作 系统 使 用 的 是 时 间 片 轮流 的 多 线程 并 发 方式 ， 所 以 在 任何 时 刻 ， 处 理 器 只 会 处 理 
当前 线程 的 指令 。 线 程 间 切换 的 并 发 要 求 每 个 线程 都 需要 有 一 个 私有 的 程序 计数 器 ， 并 且 程 序 
计数 器 间 互 不 影响 。 

当 程 序 计 数 器 存储 当前 线程 下 一 条 要 执行 的 字 节 码 的 地 址 时 ， 会 占用 较 小 的 内 存 空 间 。 所 
有 的 控制 执行 流程 (例如 分 支 、 循 环 、 返 回 、 异 常 等) 功能 都 在 程序 计数 器 的 指示 范围 之 内 ， 字 节 
码 解释 器 通过 改变 程序 计数 器 值 的 方式 来 获取 下 一 条 要 执行 的 字 节 码 的 指令 。 
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8.22 Java 的 虚拟 机 栈 VM Stack 


在 Java 平台 中 ， 虚 拟 机 栈 是 类 中 的 方法 的 执行 过 程 的 内 存 模型 。 与 程序 计数 器 一 样 ，Java 
虚拟 机 栈 (Java Virtual Machine Stacks) 也 是 线程 私有 的 ， 它 的 生命 周期 与 线程 相同 。 虚 拟 机 栈 描 
述 的 是 Java 方法 执行 的 内 存 模型 : 每 个 方法 被 执行 的 时 候 都 会 同时 创建 一 个 栈 帧 (Stack Frame) 
用 于 存储 局 部 变量 表 、 操 作 数 栈 、 动 态 链 接 、 方 法 出 口 等 信息 。 每 一 个 方法 被 调用 直至 执行 完 
成 的 过 程 ， 就 对 应 着 一 个 栈 帧 在 虚拟 机 栈 中 从 入 栈 到 出 栈 的 过 程 。 

对 于 方法 调用 来 说 ， 很 有 必要 了 解 下 栈 由 (Stack Frame) 的 概念 。 

虚拟 机 在 执行 每 个 方法 的 调用 时 会 创建 一 个 栈 帧 的 数据 结构 ， 它 是 虚拟 机 运行 时 数据 区 中 
的 虚拟 机 栈 的 栈 元 素 。 每 个 方法 的 调用 过 程 ， 就 对 应 着 一 个 栈 帧 在 虚拟 机 里 的 入 栈 出 栈 的 过 程 。 
栈 帧 包括 了 方法 的 局 部 变量 表 、 操 作 数 栈 、 动 态 链接 和 方法 出 口 等 一 些 额 外 的 附加 信息 。 对 于 
活动 线程 中 栈 项 的 帧 栈 ， 称 为 当前 栈 帧 ， 这 个 栈 帧 所 关联 的 方法 称 为 当前 方法 ， 正 在 执行 的 字 
节 码 指令 都 只 针对 当前 有 效 栈 帧 进行 操作 。 

在 栈 帧 的 基础 上 ， 不 难 理解 虚拟 机 栈 的 内 存 结构 。Java 虚拟 机 规范 规定 虚拟 机 栈 的 大 小 是 
可 以 国定 的 或 者 动态 分 配 大 小 Java 虚拟 机 实现 可 以 向 程序 员 提供 对 Java 栈 的 初始 大 小 的 控制 ， 
以 及 在 动态 扩展 或 者 收缩 Java 栈 的 情况 下 ， 控 制 Java 栈 的 最 大 值 和 最 小 值 。 

下 面 列 出 的 两 种 异常 情况 与 Java 栈 相关 。 

口 ”如果 线 程 请 求 的 栈 深 度 大 于 虚拟 机 所 允许 的 深度 ， 则 Java 虚拟 机 将 抛 出 StackOverflowError 

异常 。 

O 如果 虚拟 机 栈 可 以 动态 扩展 ， 但 是 无 法 申请 到 足够 的 内 存 来 实现 扩展 ， 或 者 不 能 得 到 
足够 的 内 存 为 一 个 新 线程 创建 初始 Java 栈 ， 则 Java 虚拟 机 将 抛 出 OutOfMemoryError 
异常 。 

有 人 通常 把 Java 内 存 区 分 为 堆 内 存 (Heap) 和 栈 内 存 (Stack)， 其 中 所 指 的 “ 栈 ” 就 是 现在 讲 

的 虚拟 机 栈 ， 或 者 说 是 虚拟 机 栈 中 的 局 部 变量 表 部 分 。 

在 局 部 变量 表 中 存放 了 编译 期 可 知 的 各 种 基本 数据 类 型 (boolean、byte、char、short、mt、 
float、long、double)、 对 象 引 用 (reference 类 型 ， 它 不 等 同 于 对 象 本 身 ， 根 据 不 同 的 虚拟 机 实现 ， 
它 可 能 是 一 个 指向 对 象 起 始 地 址 的 引用 指针 ， 也 可 能 指向 一 个 代表 对 象 的 句柄 或 者 其 他 与 此 对 
象 相关 的 位 置 ) 和 returnAddress 类 型 (指向 了 一 条 字 节 码 指令 的 地 址 )。 

其 中 64 位 的 long 和 double 类 型 的 数据 会 占用 两 个 局 部 变量 空间 (Slot)， 其 余 的 数据 类 型 只 
占用 一 个 。 局 部 变量 表 所 需 的 内 存 空间 在 编译 期 间 完 成 分 配 ， 当 进入 一 个 方法 时 ， 这 个 方法 需 
要 在 帧 中 分 配 多 大 的 局 部 变量 空间 是 完全 确定 的 , 在 方法 运行 期 间 不 会 改变 局 部 变量 表 的 大 小 。 

在 Java 虚拟 机 规范 中 ， 对 这 个 区 域 规定 了 两 种 异常 状况 : 如 果 线 程 请 求 的 栈 深度 大 于 虚拟 
机 所 允许 的 深度 ， 将 抛 出 StackOverflowError 异常 ;如果 虚 拟 机 栈 可 以 动态 扩展 (当前 大 部 分 的 
Java 虚拟 机 都 可 动态 扩展 ， 只 不 过 Java 虚拟 机 规范 中 也 允许 固定 长 度 的 虚拟 机 栈 )， 当 扩展 时 无 
法 申请 到 足够 的 内 存 时 会 抛 出 OutOfMemoryError 异常 。 


8.23 本 地 方法 栈 Native Method Stack 
在 Java 系统 中 , 在 本 地 方法 栈 中 执行 的 是 非 Java 语言 编写 的 代码 ,例如 C 或 C++。 虚 拟 机 


«mq 


栈 执行 的 是 Java 方法 字 节 码 服务 。 本 地 方法 栈 的 是 虚拟 机 使 用 本 地 方法 服务 的 ， 如 果 提 供 本 地 
方法 栈 ， 则 它们 通常 在 每 个 线程 被 创建 时 分 配 在 每 个 线程 基础 上 的 。 虚 拟 机 规范 中 对 本 地 方法 
栈 中 的 方法 使 用 的 语音 、 使 用 方式 与 数据 结构 并 没有 强制 规定 ， 因 此 有 具体 的 虚拟 机 可 以 自由 实 
现 它 。 甚 至 有 的 虚拟 机 (如 Sun HotSpot 虚拟 机 ) 直 接 就 把 本 地 方法 栈 和 虚拟 机 栈 合 二 为 一 。 

同 虚 拟 机 栈 一 样 , 本 地 方法 栈 也 会 出 现 与 虚拟 机 栈 类 似 的 异常 ,也 会 抛 出 StackOverflowError 
和 OutOfMemoryError 异常 。 


8.24 Java 堆 (Java Heap) 


Java 堆 是 类 实例 和 数组 的 分 配 空间 ， 是 一 块 所 有 线程 共享 的 内 存 区 域 。 堆 在 虚拟 机 启动 时 
创建 ， 是 Java 虚拟 机 所 管理 的 内 存 中 最 大 的 一 块 。 内 存 泄漏 和 溢出 问题 大 都 发 生 在 堆 区 域 。 所 
示 对 于 大 多 数 应 用 来 说 ，Java 堆 (Java Heap) 是 Java 虚拟 机 所 管理 的 内 存 中 最 大 的 一 块 。 

Java 堆 内 存 区 域 的 唯一 目的 就 是 存放 对 象 实例 ， 几 乎 所 有 的 对 象 实例 都 在 这 里 分 配 内 存 。 
这 一 点 在 《Java 虚拟 机 规范 》 中 的 描述 是 : 所 有 的 对 象 实例 以 及 数组 都 要 在 堆 上 分 配 ， 但 是 随 
着 JIT 编译 器 的 发 展 与 逃逸 分 析 技 术 的 逐渐 成 熟 ， 栈 上 分 配 、 标 量 蔡 换 优 化 技术 将 会 导致 一 些 
微妙 的 变化 发 生 ， 所 有 的 对 象 都 分 配 在 堆 上 也 渐渐 变 得 不 是 那么 “绝对 ”了 。 

(Java 虚拟 机 规范 》 规 定 堆 在 内 存单 元 中 只 要 在 逻辑 上 是 连续 的 ，Java 堆 是 可 以 是 固定 大 
小 的 ， 或 者 按照 需求 做 动态 扩展 ， 并 且 可 以 在 一 个 大 的 堆 变 的 不 必要 时 收缩 。Java 虚拟 机 的 实 
现 向 程序 员 或 者 用 户 提供 了 对 堆 初始 化 大 小 的 控制 ， 以 及 对 堆 动态 扩展 和 收缩 的 最 大 值 和 最 小 
值 的 控制 。 

上 述 异 常 与 Java 堆 相 关 。 如 果 堆 中 没有 可 用 内 存 完成 类 实例 或 者 数组 的 分 配 ， 在 对 象 数 量 
达到 最 大 堆 的 容量 限制 后 将 抛 出 OutOfMemoryError 异常 。 

Java 堆 也 是 垃圾 收集 器 管理 的 主要 区 域 , 因此 很 多 时 候 也 被 称 作 “GC HE” (Garbage Collected 
Heap)。 如 果 从 内 存 回收 的 角度 看 ， 由 于 现在 收集 器 基本 都 是 采用 的 分 代 收 集 算法 ， 所 以 Java 
堆 中 还 可 以 继续 细 分 为 : 新 生 代 和 老年 代 。 如果 再 细致 一 点 , 可 以 分 为 Eden 空间 、From Survivor 
空间 、To Survivor 空间 等 。 如 果 从 内 存 分 配 的 角度 看 ， 线 程 共享 的 Java 堆 中 可 能 划分 出 多 个 线 
程 私 有 的 分 配 缓冲 区 (Thread Local Allocation Buffer，TLAB)。 但 是 无 论 如 何 划 分 ， 都 与 存放 内 
容 无 关 ， 无 论 哪个 区 域 ， 存 储 的 都 仍然 是 对 象 实例 。 进 一 步 划 分 的 目的 是 为 了 更 好 地 回收 内 存 ， 
或 者 更 快 地 分 配 内 存 。 

(Java 虚拟 机 规范 》 规 定 : Java 堆 可 以 处 于 物理 上 不 连续 的 内 存 空 间 中 ， 只 要 逻辑 上 是 连 
续 的 即 可 ， 就 像 我 们 的 磁盘 空间 一 样 。 在 实现 时 ， 既 可 以 实现 成 固定 大 小 的 ， 也 可 以 是 可 扩展 
的 ， 不 过 当前 主流 的 虚拟 机 都 是 按照 可 扩展 来 实现 的 (通过 -Xmx 和 -Xms 控制 )。 


8.2.5 方法 区 


在 Java 系统 中 ， 方 法 区 在 虚拟 机 启动 时 创建 ， 是 一 块 所 有 线程 共享 的 内 存 区 域 。 方 法 区 用 
于 存储 已 被 虚拟 机 加 载 的 类 人 信息、 常量、 静态 变量 、 即 时 编译 器 编译 后 的 代码 等 数据 。 总 而 言 
zo 方法 区 类 似 于 传统 语言 的 编译 后 代码 的 存储 区 。 

方法 区 (Method Area) 与 Java 堆 一 样 ， 是 各 个 线程 共享 的 内 存 区 域 ， 用 于 存储 已 被 虚拟 机 加 
载 的 类 人 信息、 常量、 静态 变量 、 即 时 编译 器 编译 后 的 代码 等 数据 。 虽 然 Java 虚拟 机 规范 把 方法 
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区 描述 为 堆 的 一 个 逻辑 部 分 ， 但 是 它 却 有 一 个 别名 叫 作 Non-Heap( 非 堆 )， 目 的 应 该 是 与 Java HE 
区 分 开 来 。 

对 于 习惯 在 HotSpot 虚拟 机 上 开发 和 部 署 程序 的 开发 者 来 说 , 很 多 人 愿意 把 方法 区 称 为 “ 永 
AAR” (Permanent Generation)。 但 本 质 上 两 者 并 不 等 价 ， 仅 仅 是 因为 HotSpot 虚拟 机 的 设计 团队 
选择 把 GC 分 代 收 集 扩展 至 方法 区 ， 或 者 说 使 用 永久 代 来 实现 方法 区 而 已 。 对 于 其 他 虚拟 机 (如 
BEA JRockit. IBM J9 等 ) 来 说 是 不 存在 永久 代 的 概念 的 。 即 使 是 HotSpot 虚拟 机 本 身 ， 根 据 官方 
发 布 的 路 线 图 信息 ， 现 在 也 有 放弃 永久 代 并 “搬家 ”至 Native Memory 来 实现 方法 区 的 规划 了 。 

Java 虚拟 机 规范 对 这 个 区 域 的 限制 非常 宽松 ， 除 了 和 Java 堆 一 样 不 需要 连续 的 内 存 和 可 以 
选择 固定 大 小 或 者 可 扩展 外 ， 还 可 以 选择 不 实现 垃圾 收集 。 相 对 而 言 ， 垃 圾 收集 行为 在 这 个 
域 是 比较 少 出 现 的 ， 但 并 非 数据 进入 了 方法 区 就 如 永久 代 的 名 字 一 样 “ 永 久 ” 存 在 了 。 这 个 
域 的 内 存 回收 目标 主要 是 针对 常量 池 的 回收 和 对 类 型 的 卸载 ， 一 般 来 说 这 个 区 域 的 回收 “成 绩 ” 
比较 难以 令 人 满意 ， 尤 其 是 类 型 的 卸载 ， 条 件 相当 苛刻 ， 但 是 这 部 分 区 域 的 回收 确实 是 有 必要 
的 。 在 Sun 公司 的 BUG 列表 中 ， 曾 出 现 过 的 若干 个 严重 的 BUG 就 是 由 于 低 版 本 的 HotSpot 虚 
拟 机 对 此 区 域 未 完全 回收 而 导致 内 存 泄漏 。 

虽然 Java 虚拟 机 规范 在 逻辑 上 把 方法 区 描述 为 堆 的 一 个 部 分 ， 但 是 在 垃圾 回收 方面 的 限制 
却 比较 宽松 ， 宽 松 到 方法 区 可 以 不 用 实现 垃圾 回收 。 但 是 ， 垃 圾 回收 在 方法 区 还 是 必须 有 的 ， 
只 是 回收 效果 不 是 很 明显 。 这 个 区 域 的 回收 目标 主要 针对 的 是 常量 池 的 回收 和 对 类 型 的 印 载 。 

方法 区 的 大 小 也 可 以 控制 ， 以 下 异常 与 方法 区 相关 : 

如 果 方 法 区 无 法 满足 内 存 分 配 需 求 时 ， 将 会 抛 出 OutOfMemoryError 异常 。 


8.26 ”运行 时 常量 池 


运行 时 常量 池 ( Runtime Constant Pool) 是 方法 区 的 一 部 分 。 在 Class 文件 中 除了 有 类 的 版 本 、 
字段 、 方 法 、 接 口 等 描述 等 信息 外 ， 还 有 一 项 信息 是 常量 池 (Constant Pool Table)， 用 于 存放 编 
译 期 生成 的 各 种 字面 量 和 符号 引用 ,这 部 分 内 容 将 在 类 加 载 后 存放 到 方法 区 的 运行 时 常量 池 中 。 

常量 池 是 每 个 类 的 Class 文件 中 存储 编译 期 生成 的 各 种 字面 量 和 符号 引用 的 运行 期 表示 , 其 
数据 结构 是 一 种 由 无 符号 数 和 表 组 长 的 类 似 于 C 语言 结构 体 的 伪 结构 。 另 外 ， 常 量 池 也 是 方法 
区 的 一 部 分 , 类 的 常量 池 在 该 类 的 Java class 文件 被 Java 虚拟 机 成 功 地 装载 时 创建 , 这 部 分 内 容 
在 类 加 载 后 存放 到 方法 区 的 运行 时 常量 池 中 。 

Java 虚拟 机 对 Class 文件 的 每 一 部 分 (自然 也 包括 常量 池 ) 的 格式 都 有 严格 的 规定 ， 每 一 个 字 
节 用 于 存储 哪 种 数据 都 必须 符合 规范 上 的 要 求 ， 这 样 才 会 被 虚拟 机 认可 、 装 载 和 执行 。 但 对 于 
运行 时 常量 池 来 说 ，Java 虚拟 机 规范 没有 做 任何 细节 的 要 求 ， 不 同 的 提供 商 实现 的 虚拟 机 可 以 
按照 自己 的 需要 来 实现 这 个 内 存 区 域 。 不 过 ,一 般 来 说 ,除了 保存 Class 文件 中 描述 的 符号 引用 
外 ， 还 会 把 翻译 出 来 的 直接 引用 也 存储 在 运行 时 常量 池 中 。 

运行 时 常量 池 相 对 于 Class 文件 常量 池 的 另外 一 个 重要 特征 是 具备 动态 性 , Java 并 不 要 求 常 
量 一 定 只 能 在 编译 期 产生 , 也 就 是 并 非 预 置 入 Class 文件 中 常量 池 的 内 容 才能 进入 方法 区 运行 时 
常量 池 , 运行 期 间 也 可 能 将 新 的 常量 放 入 池 中 , 这 种 特性 被 开发 人 员 利用 得 比较 多 的 便 是 String 
类 的 intern0 方 法 。 

既然 运行 时 常量 池 是 方法 区 的 一 部 分 ， 自 然 会 受到 方法 区 内 存 的 限制 ， 当 常量 池 无 法 再 申 
请 到 内 存 时 会 抛 出 OutOfMemoryError 异常 。 运行 时 常量 池 属 于 方法 区 ， 自 然 也 受到 方法 区 内 存 
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大 小 的 限制 ， 以 下 异常 与 常量 池 有 关 : 

在 装载 Class 文件 时 ， 如 果 常 量 池 的 创建 需要 比 Java 虚拟 机 的 方法 区 中 需求 更 多 的 内 存 时 ， 
将 会 抛 出 OutOfMemoryError 异常 。 


注意 : 对 于 虚拟 机 运行 时 数据 区 域 的 划分 及 每 个 区 域 作 用 ， 存 储 内 容 及 可 能 出 现 的 异常 有 了 一 
个 大 致 的 了 解 。Java 的 自动 内 存 分 配 和 垃圾 回收 筑 起 的 这 道 高 墙 ， 在 出 现 内 存 泄漏 或 者 
溢出 的 情况 下 ， 这 道 高 墙 就 必须 翻越 了 。 


8.27 ”直接 内 存 


直接 内 存 并 不 是 虚拟 机 运行 时 数据 区 的 一 部 分 ， 不 是 Java 虚拟 机 规范 中 定义 的 内 存 区 域 ， 
但 是 这 部 分 内 存 也 被 频繁 地 使 用 ， 而 且 也 可 能 导致 OutOfMemoryError 异常 出 现 。 

从 IDK 1.4 版 本 开始 ， 新 加 入 了 NIO(New Input/Output) 类 ， 并 且 引 入 了 一 种 基于 通道 
(Channel) 与 缓冲 区 (Buffer) 的 VO 方式 ， 它 可 以 使 用 Native 函数 库 直 接 分 配 堆 外 内 存 ， 然 后 通过 
一 个 存储 在 Java 堆 里 面 的 DirectByteBuffer 对 象 作为 这 块 内 存 的 引用 进行 操作 。 这 样 能 在 一 些 场 
景 中 显著 提高 性 能 ， 因 为 避免 了 在 Java HEA Native 堆 中 来 回复 制 数据 。 

显然 ， 本 机 直接 内 存 的 分 配 不 会 受到 Java. 堆 大 小 的 限制 ， 但 是 既然 是 内 存 ， 肯 定 还 是 会 受 
到 本 机 总 内 存 (包括 RAM 及 SWAP 区 或 者 分 页 文件 ) 的 大 小 及 处 理 器 寻 址 空间 的 限制 。 服 务 器 
管理 员 配 置 虚 拟 机 参数 时 ， 一 般 会 根据 实际 内 存 设置 “Xmx” 等 参数 信息 ， 但 经 常会 忽略 掉 直 
接 内 存 ， 使 得 各 个 内 存 区 域 的 总 和 大 于 物理 内 存 限制 (包括 物理 上 的 和 操作 系统 级 的 限制 )， 从 而 
导致 动态 扩展 时 出 现 OutOfMemoryError 异常 。 
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要 想 真正 深入 理解 VM 的 对 象 访问 机 制 ， 需 要 先 了 解 VM 具体 地 的 逻辑 内 存 模型 。JVM 
的 逻辑 内 存 模型 如 图 8-4 所 示 。 
类 装载 子 系统 


;法 区 atè 程序 


运行 期 数据 区 


执行 引擎 
本 地 方法 接口 


图 8-4 JVM 的 逻辑 内 存 模型 
本 节 将 通过 逻辑 内 存 模型 来 讲解 对 象 访问 的 应 用 知识 。 
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8.8.10 对象 访问 基础 


当 我 们 建立 一 个 对 象 的 时 候 是 怎么 进行 访问 的 呢 ? 在 Java 中 ， 对 象 访问 是 如 何 进 行 的 呢 ? 
对 象 访问 在 Java 中 无 处 不 在 , 是 最 普通 的 程序 行为 , 但 即使 是 最 简单 的 访问 , 也 会 涉及 Java 栈 、 
Java 堆 、 方 法 区 这 三 个 最 重要 内 存 区 域 之 间 的 关联 关系 ， 如 下 面 的 代码 。 


Object obj = new Object(); 


假设 这 句 代码 出 现在 方法 体 中 ， 那 “Object obj” 这 部 分 的 语义 将 会 反映 到 Java 栈 的 本 地 变 
量 表 中 ， 作 为 一 个 reference 类 型 数据 出 现 。 而 “new Object0” 这 部 分 的 语义 将 会 反映 到 Java 
堆 中 ， 形 成 一 块 存储 了 Object 类 型 所 有 实例 数据 值 (Instance Data， 对 象 中 各 个 实例 字段 的 数据 ) 
的 结构 化 内 存 中 。 根据 具体 类 型 以 及 虚拟 机 实现 的 对 象 内 存 布局 (Object Memory Layout) 的 不 同 ， 
这 块 内 存 的 长 度 是 不 固定 的 。 另 外 ， 在 Java 堆 中 还 必须 包含 能 查找 到 此 对 象 类 型 数据 (如 对 象 
类 型 、 父 类 、 实 现 的 接口 、 方 法 等 ) 的 地 址 信息 ， 这 些 类 型 数据 则 存储 在 方法 区 中 。 

由 于 reference 类 型 在 Java 虚拟 机 规范 里 只 规定 了 一 个 指向 对 象 的 引用 ， 并 没有 定义 这 个 
引用 应 该 通过 哪 种 方式 去 定位 ， 以 及 访问 到 Java 堆 中 的 对 象 的 具体 位 置 ， 因此 不 同 的 虚拟 机 实 
现 的 对 象 访问 方式 会 有 所 不 同 ， 主 流 的 访问 方式 有 两 种 : 使 用 句柄 和 直接 指针 。 

(1) 如 果 使 用 句柄 访问 方式 ，Java 堆 中 将 会 划分 出 一 块 内 存 来 作为 句柄 池 ，reference 中 存 
储 的 就 是 对 象 的 句柄 地 址 ， 而 句柄 中 包含 了 对 象 实例 数据 和 类 型 数据 各 自 的 具体 地 址 信息 ， 如 
图 8-5 所 示 。 


8-5 用 句柄 访问 对 象 


Q) 如 果 使 用 直接 指针 访问 方式 ，Java 堆 对 象 的 布局 中 就 必须 考虑 如 何 放置 访问 类 型 数据 
的 相关 信息 ，reference 中 直接 存储 的 就 是 对 象 地 址 ， 如 图 8-6 所 示 。 

这 两 种 对 象 的 访问 方式 各 有 优势 。 使 用 句柄 访问 方式 的 最 大 好 处 就 是 reference 中 存储 的 是 
稳定 的 句柄 地 址 , 在 对 象 被 移动 (垃圾 收集 时 移动 对 象 是 非常 普遍 的 行为 ) 时 只 会 改变 句柄 中 的 实 
例 数 据 指 针 ， 而 reference 本 身 不 需要 被 修改 。 

使 用 直接 指针 访问 方式 的 最 大 好 处 就 是 速度 更 快 ， 它 节省 了 一 次 指针 定位 的 时 间 开 销 ， 由 
于 对 象 的 访问 在 Java 中 非常 频繁 ， 因 此 这 类 开销 积 少 成 多 后 也 是 一 项 非常 可 观 的 执行 成 本 。 就 
本 书 讨论 的 主要 虚拟 机 Sun HotSpot 而 言 , 它 是 使 用 第 二 种 方式 进行 对 象 访问 的 , 但 从 整个 软件 
开发 的 范围 来 看 ， 各 种 语言 和 框架 使 用 句柄 来 访问 的 情况 也 十 分 常见 。 


«ap 


局 有 和 理解 naroia 应 所 机 二 


到 对 象 类 型 数据 的 指针 | 
对 象 实例 数据 


对 象 类 型 数据 


图 8-6 通过 指针 访问 对 象 


8.3.2 具体 测试 


本 节 将 通过 几 个 示例 来 演示 Java 虚拟 机 内 存 操作 的 基本 知识 。 

1. Java 堆 溢 出 

在 示例 中 我 们 限制 Java 堆 的 大 小 为 20MB, 不 可 扩展 (将 堆 的 最 小 值 -Xms 参 数 与 最 大 值 -Xmx 
参数 设置 为 一 样 即 可 避免 堆 自动 扩展 )， 通 过 参数 -XX:+HeapDumpOnOutOfMemoryError 可 以 让 


虚拟 机 在 出 现 内 存 溢出 异常 时 备份 出 当前 的 内 存 堆 转 储 快 照 以 便 事 后 进行 分 析 。 有 具体 参数 设置 
如 图 8-7 一 图 8-9 所 示 。 


图 8-7 参数 设置 
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Bes 参数 设置 


Name: HeapOutOfMemory 


Program arguments: 
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下 面 是 测试 代码 。 


图 8-9 参数 设置 


package com.aaa.jvm.memory.heap; 
import java.util.ArrayList; 
import java.util.List; 
public class HeapOutOfMemory { 
public static void main(String[] args) { 
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List«TestCase» cases = new ArrayList«TestCase-(); 
while(true)( 
cases.add(new TestCase()); 
} 
} 
} 


class TestCase{ 


} 
运行 后 的 结果 如 下 。 
java.lang.OutOfMemoryError: Java heap space 
Dumping heap to java pid3404.hprof .. 
Heap dump file created [22045981 bytes in 0.663 secs] 

Java 堆 内 存 的 OOM 异常 是 实际 应 用 中 最 常见 的 内 存 溢出 异常 情况 。 出 现 Java HEY Ed Ui 
时 ， 异 常 堆栈 信息 “java.lang.OutOfMemoryError” 会 跟着 进一步 提示 “Java heap space”。 

要 解决 这 个 区 域 的 异常 ， 一 般 的 手段 是 首先 通过 内 存 映像 分 析 工 具 (如 EclipseMemory 
Analyzer) 对 备份 出 来 的 堆 转 储 快照 进行 分 析 。 重 点 是 确认 内 存 中 的 对 象 是 否 是 必要 的 ， 也 就 是 
说 要 先 分 清楚 到 底 是 出 现 了 内 存 泄漏 [Memory Leak) 还 是 内 存 溢出 (Memory Overflow)。 如 果 是 内 
存 泄漏 ， 可 进一步 通过 工具 查看 泄漏 对 象 到 GC Roots 的 引用 链 。 于 是 就 能 找到 泄漏 对 象 是 通过 
什么 样 的 路 径 与 GC Roots 相关 联 并 导致 垃圾 收集 器 无 法 自动 回收 它们 的 。 掌 握 了 泄漏 对 象 的 类 
型 信息 ， 以 及 GC Roots 引用 链 的 信息 ， 就 可 以 比较 准确 地 定位 出 泄漏 代码 的 位 置 。 如 果 不 存在 
泄漏 ， 换 句 话说 就 是 内 存 中 的 对 象 确实 都 还 存在 着 ， 那 就 应 当 检查 虚拟 机 的 堆 参数 (-Xmx 与 
-Xms), 与 机 器 物理 内 存 对 比 看 是 否 还 可 以 调 大 , 从 代码 上 检查 是 否 存在 某 些 对 象 生命 周期 过 长 、 
持 有 状态 时 间 过 长 的 情况 ， 尝 试 减少 程序 运行 期 的 内 存 消耗 。 


2. 虚拟 机 栈 和 本 地 方法 栈 溢出 


由 于 在 HotSpot 虚拟 机 中 并 不 区 分 虚拟 机 栈 和 本 地 方法 栈 ， 因 此 对 于 HotSpot 虚拟 机 来 说 ， 
-Xoss 参数 (设置 本 地 方法 栈 大 小 ) 虽 然 存 在 ， 但 实际 上 是 无 效 的 ， 栈 容量 只 由 -Xss 参数 设 定 。 关 
于 虚拟 机 栈 和 本 地 方法 栈 ， 在 Java 虚拟 机 规范 中 描述 了 两 种 异常 。 

O ”如 果 线 程 请 求 的 栈 深度 大 于 虚拟 机 所 允许 的 最 大 深度 ， 将 抛 出 StackOverflowError 

异常 。 

Q 如果 虚 拟 机 在 扩展 栈 时 无 法 申请 到 足够 的 内 存 空间 ， 则 抛 出 OutOfMemoryError 异常 。 

这 里 把 异常 分 成 两 种 情况 看 似 更 加 严谨 ， 但 却 存在 着 一 些 互 相 重 从 的 地 方 ， 当 栈 空间 无 法 
继续 分 配 时 ， 到 底 是 内 存 太 小 ， 还 是 已 使 用 的 栈 空间 太 大 ， 其 本 质 上 只 是 对 同一 件 事 情 的 两 种 
描述 而 已 。 

在 具体 测试 中 会 发 现 ， 如 果 将 实验 范围 限制 于 单线 程 中 的 操作 ， 尝 试 了 下 面 两 种 方法 均 无 
法 让 虚拟 机 产生 OutOfMemoryError 异常 ， 尝 试 的 结果 都 是 获得 StackOverflowError 异常 。 

例如 下 面 的 代码 会 造成 栈 溢出 。 

package com.aaa.jvm.memory.stack; 

public class StackOverFlow ( 

private int i ; 


public void plus() ( 
iet; 
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plus(); 


} 
public static void main(String[] args) { 
StackOverFlow stackOverFlow = new StackOverFlow(); 
try { 
stackOverFlow.plus() ; 
} catch (Exception e) { 
System.out.println("Exception:stack length:"+stackOverFlow.i) ; 
e.printStackTrace () ; 
} catch (Error e) { 
System.out.println("Error:stack length:"+stackOverFlow.i) ; 
e.printStackTrace () ; 


} 
} 
通过 测试 表明 : 在 单个 线程 下 ， 无 论 是 由 于 栈 帧 太 大 ， 还 是 虚拟 机 栈 容量 太 小 ， 当 内 存 无 
法 分 配 时 ， 虚 拟 机 抛 出 的 都 是 StackOverflowError 异常 。 如 果 测 试 时 不 限于 单线 程 ， 通 过 不 断 地 
建立 线程 的 方式 倒是 可 以 产生 内 存 溢 出 异常 。 但 是 ， 这 样 产 生 的 内 存 溢出 异常 与 栈 空间 是 否 足 
够 大 并 不 存在 任何 联系 ， 或 者 准确 地 说 ， 在 这 种 情况 下 ， 给 每 个 线程 的 栈 分 配 的 内 存 越 大 ， 反 
而 越 容易 产生 内 存 溢出 异常 。 其 原因 其 实 不 难 理解 ， 操 作 系 统 分 配给 每 个 进程 的 内 存 是 有 限制 
的 ， 辟 如 32 位 的 Windows 限制 为 2GB。 虚 拟 机 提供 了 参数 来 控制 Java 堆 和 方法 区 的 这 两 部 分 
内 存 的 最 大 值 。 剩 余 的 内 存 为 2GB( 操 作 系 统 限制 ) 减 去 Xmx( 最 大 堆 容 量 )， 再 减 去 
MaxPermSize( 最 大 方法 区 容量 )， 程 序 计数 器 消耗 内 存 很 小 ， 可 以 忽略 掉 。 如 果 虚 拟 机 进程 本 身 
耗费 的 内 存 不 计算 在 内 ， 剩 下 的 内 存 就 由 虚拟 机 栈 和 本 地 方法 栈 “ 瓜 分 ”了 。 每 个 线程 分 配 到 
的 栈 容 量 越 大 ， 可 以 建立 的 线程 数量 自然 就 越 少 ， 建 立 线程 时 也 就 越 容易 把 剩 下 的 内 存 耗 尽 。 
这 一 点 读者 需要 在 开发 多 线程 应 用 时 特别 注意 , 出 现 StackOverflowError 异常 时 有 错误 堆栈 可 以 
阅读 ， 相 对 来 说 ， 比 较 容易 找到 问题 的 所 在 。 而 且 ， 如 果 使 用 虚拟 机 默认 参数 ， 栈 深度 在 大 多 
数 情况 下 (因为 每 个 方法 压 入 栈 的 帧 大 小 并 不 是 一 样 的 ， 所 以 只 能 说 大 多 数 情况 下 ) 达 到 1000 一 
2000 是 完全 没有 问题 的 ， 对 于 正常 的 方法 调用 (包括 递归 )， 这 个 深度 应 该 完全 够 用 了 。 但 是 ， 
如 果 是 建立 过 多 线程 导致 的 内 存 涪 出 ， 在 不 能 减少 线程 数 或 者 更 换 64 位 虚拟 机 的 情况 下 ， 就 只 
能 通过 减少 最 大 堆 和 减少 栈 容量 来 换取 更 多 的 线程 。 如 果 没 有 这 方面 的 经 验 ， 这 种 通过 “减少 
内 存 ” 的 手段 来 解决 内 存 溢出 的 方式 会 比较 难以 想到 。 
例如 ， 下 面 的 代码 在 创建 线程 时 会 导致 OOM 异常 。 
public class JavaVMStackooM { 
private void dontStop() { 
while (true) { 
} 
baler void stackLeakByThread() { 
while (true) { 
Thread thread = new Thread(new Runnable() { 
GOverride 


public void run() { 
dontStop(); 


} 
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thread.start(); 

} 

} 

public static void main(String[] args) throws Throwable { 
JavaVMStackOOM oom = new JavaVMStackOOM () ; 
oom. stackLeakByThread () ; 

} 

} 


如 果 读者 要 运行 上 面 这 段 代 码 ， 记 得 要 存储 当前 的 工作 ， 在 执行 上 述 代码 时 有 很 大 可 能 会 
令 操作 系统 出 现 卡 死 的 风险 。 运 行 后 的 结果 如 下 。 

Exception in thread "main" java.lang.OutOfMemoryError: unable to create new native thread 

3. 运行 时 常量 池 

如 果 要 向 运行 时 常量 池 中 添加 内 容 ， 最 简单 的 做 法 就 是 使 用 Native 方法 String.intemQ. 1% 
方法 的 作用 是 : 如 果 池 中 已 经 包含 一 个 等 于 此 String 对 象 的 字符 串 ， 则 返回 代表 池 中 这 个 字符 
HA) String WA; AM, KE String 对 象 包含 的 字符 串 添 加 到 常量 池 中 ， 并 且 返 回 此 String 对 
象 的 引用 。 由 于 常量 池 分 配 在 方法 区 内 ， 我 们 可 以 通过 -XX:PermSize 和 -XX:MaxPermSize 限制 
方法 区 的 大 小 ， 从 而 间接 限制 其 中 常量 池 的 容量 。 例 如 下 面 的 代码 。 

package com.aaa.jvm.memory.constant; 

import java.util.ArrayList; 

import java.util.List; 


public class ConstantOutOfMemory { 
public static void main(String[] args) throws Exception { 


try { 
List<String> strings = new ArrayList«String»(); 
int i z 0; 


while(true)( 
strings.add(String.valueOf (i++) .intern()); 


} catch (Exception e) { 
e.printStackTrace () ; 
throw e; 


} 
} 
} 


从 运行 结果 中 可 以 看 到 ,运行 时 常量 池 浇 出 , 在 OutOfMemoryError 后 面 跟随 的 提示 信息 是 
“PermGen space”， 说 明 运 行 时 常量 池 属 于 方法 区 (HotSpot 虚拟 机 中 的 永久 代 ) 的 一 部 分 。 


4. 方法 区 溢出 

方法 区 用 于 存放 Class 相关 信息 ， 所 以 这 个 区 域 的 测试 我 们 借助 CGLib 直接 操作 字 节 码 动 
态 生成 大 量 的 Class， 值 得 注意 的 是 ， 这 里 我 们 这 个 例子 中 模拟 的 场景 其 实 经 常会 在 实际 应 用 中 
出 现 : 当前 很 多 主流 框架 ， 如 Spring, Hibernate 对 类 进行 增强 时 ， 都 会 使 用 到 CGLib 这 类 字 节 
码 技术 ， 当 增强 的 类 越 多 ， 就 需要 越 大 的 方法 区 用 于 保证 动态 生成 的 Class 可 以 加 载 入 内 存 。 

例如 下 面 的 代码 会 产生 方法 区 溢出 : 


package com.aaa.jvm.memory.methodArea; 
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import java.lang.reflect.Method; 
import net.sf.cglib.proxy.Enhancer; 
import net.sf.cglib.proxy.MethodInterceptor; 
import net.sf.cglib.proxy.MethodProxy; 
public class MethodAreaOutOfMemory { 
public static void main(String[] args) { 
while(true)( 
Enhancer enhancer - new Enhancer(); 
enhancer.setSuperclass (TestCase.class); 
enhancer.setUseCache (false) ; 
enhancer.setCallback (new MethodInterceptor() { 
GOverride 
public Object intercept (Object arg0, Method argl, Object[] arg2, 
MethodProxy arg3) throws Throwable { 
return arg3.invokeSuper(arg0, arg2); 


} 
Ds 
enhancer.create(); 
} 
} 

} 

class TestCase{ 

} 


再 看 在 下 面 的 代码 中 ， 借 助 CGLib 使 得 方法 区 出 现 OOM 异常 。 


public class JavaMethodAreaOOM { 
public static void main(String[] args) { 
while (true) { 

Enhancer enhancer - new Enhancer(); 

enhancer.setSuperclass (00MObject .class); 

enhancer.setUseCache (false); 

enhancer.setCallback (new MethodInterceptor() { 

public Object intercept (Object obj, Method method, Object [] args, 
MethodProxy proxy) throws Throwable { 
return proxy.invokeSuper(obj, args); 


} 
E 
enhancer.create(); 
} 
} 
static class OOMObject { 
} 


} 
运行 后 的 结果 如 下 。 
Caused by: java.lang.OutOfMemoryError: PermGen space 
at java.lang.ClassLoader.defineClass1 (Native Method) 
at java.lang.ClassLoader .defineClassCond (ClassLoader. java:632) 


at java.lang. ClassLoader .defineClass (ClassLoader.java:616) 
... 8 more 


方法 区 溢出 也 是 一 种 常见 的 内 存 溢出 异常 ， 一 个 类 如 果 要 被 垃圾 收集 器 回收 掉 ， 判 定 条 件 
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是 非常 苛刻 的 。 在 经 常 动态 生成 大 量 Class 的 应 用 中 ， 需 要 特别 注意 类 的 回收 状况 。 这 类 场景 除 
了 上 面 提 到 的 程序 使 用 了 CGLIB 字 节 码 增强 外 , 常见 的 还 有 大 量 ISP 或 动态 产生 ISP 文件 的 应 
用 (JSP 第 一 次 运行 时 需要 编译 为 Java 类 )、 基于 OSGi 的 应 用 (即使 是 同一 个 类 文件 , 被 不 同 的 加 
载 器 加 载 也 会 视 为 不 同 的 类 ) 等 。 


5. 本 机 直接 内 存 


DirectMemory 容量 可 通过 -XX:MaxDirectMemorySize 指定 ， 缺 省 时 与 Java 堆 (-Xmx 指定 ) 
一 样 ， 下 文 代码 越过 了 DirectByteBuffer， 直 接 通 过 反射 获取 Unsafe 实例 进行 内 存 分 配 (Unsafe 
类 的 getUnsafe0 方 法 限制 了 只 有 引导 类 加 载 器 才 会 返回 实例 ， 也 就 是 基本 上 只 有 rtjar 里 面 的 类 
的 才能 使 用 )， 因 为 DirectByteBuffer 也 会 抛 OOM 异常 , 但 抛 出 异常 时 实际 上 并 没有 真正 向 操作 
系统 申请 分 配 内 存 ， 而 是 通过 计算 得 知 无 法 分 配 既 会 抛 出 ， 真 正 申请 分 配 的 方法 是 


unsafe.allocateMemory()。 


public class DirectMemoryOOM { 

private static final int _1MB = 1024 * 1024; 

public static void main(String[] args) throws Exception { 
Field unsafeField = Unsafe.class.getDeclaredFields() [0]; 
unsafeField.setAccessible (true); 
Unsafe unsafe - (Unsafe) unsafeField.get (null); 
while (true) { 

unsafe.allocateMemory (_1MB) ; 

} 


} 
} 
运行 后 的 结果 如 下 。 


Exception in thread "main" java.lang.OutOfMemoryError 
at sun.misc.Unsafe.allocateMemory (Native Method) 
at org.fenixsoft.oom.DirectMemoryOOM.main (DirectMemoryOOM. java: 20) 


84 内 存 汇 漏 


在 计算 机 科学 中 ， 内 存 泄漏 (Memory Leak) 是 指 由 于 疏 包 或 错误 造成 程序 未 能 释放 已 经 不 再 
使 用 的 内 存 的 情况 。 内 存 泄 漏 并 非 指 内 存在 物理 上 的 消失 ， 而 是 指 应 用 程序 分 配 某 段 内 存 后 ， 
由 于 设计 错误 ， 失 去 了 对 该 段 内 存 的 控制 ， 因 而 造成 了 内 存 的 浪费 。 内 存 泄 漏 与 许多 其 他 问题 
有 着 相似 的 症状 ， 并 且 通 常情 况 下 只 能 由 那些 可 以 获得 程序 源 代码 的 程序 员 才 可 以 分 析出 来 。 
然而 ， 有 不 少 人 习惯 把 任何 不 需要 的 内 存 使 用 的 增加 描述 为 内 存 泄漏 ， 严 格 意义 上 来 说 这 是 不 
准确 的 。 一 般 常 说 的 内 存 泄漏 是 指 堆 内 存 的 泄漏 。 堆 内 存 是 指 程序 从 堆 中 分 配 的 , 大 小 任意 的 (内 
存 块 的 大 小 可 以 在 程序 运行 期 决定 ), 使 用 完 后 必须 显 式 释 放 的 内 存 。 应 用 程序 一 般 使 用 malloc、 
realloc, new 等 函数 从 堆 中 分 配 到 一 块 内 存 ， 使 用 完 后 ， 程 序 必 须 负责 相应 的 调用 free 或 delete 
释放 该 内 存 块 ， 否 则 这 块 内 存 就 不 能 被 再 次 使 用 ， 我 们 就 说 这 块 内 存 泄漏 了 。 
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8.4.1 ”内 存 泄漏 的 分 类 


内 存 泄漏 通常 分 为 如 下 4 类 。 

(1) 常 发 性 内 存 泄漏 

发 生 内 存 泄漏 的 代码 会 被 多 次 执行 ， 每 次 被 执行 的 时 候 都 会 导致 一 块 内 存 泄漏 。 

D 偶发 性 内 存 泄漏 

发 生 内 存 泄 漏 的 代码 只 有 在 某 些 特 定 环境 下 或 操作 过 程 中 才 会 发 生 ， 常 发 性 和 偶发 性 是 相 
对 的 。 对 于 特定 的 环境 ， 偶 发 性 的 也 许 就 变 成 了 常 发 性 的 。 所 以 测试 环境 和 测试 方法 对 检测 内 
存 泄漏 是 至 关 重 要 的 。 

G) 一 次 性 内 存 泄漏 

发 生 内 存 泄漏 的 代码 只 会 被 执行 一 次 ， 或 者 由 于 算法 上 的 缺陷 ， 导 致 总 会 有 一 块 且 仅 一 块 
内 存 发 生 泄漏 。 比 如 ， 在 一 个 Singleton 类 的 构造 函数 中 分 配 内 存 ， 在 析 构 函数 中 却 没有 释放 该 
内 存 。 而 Singleton 类 只 存在 一 个 实例 ， 所 以 内 存 泄漏 只 会 发 生 一 次 。 

(4) 隐 式 内 存 泄漏 

程序 在 运行 过 程 中 不 停 地 分 配 内 存 ， 但 是 直到 程序 结束 时 才 释 放 内 存 。 严 格 地 说 这 里 并 没 
有 发 生 内 存 泄漏 ， 因 为 最 终 程序 释放 了 所 有 申请 的 内 存 。 但 是 对 于 一 个 服务 器 程序 来 说 ， 需 要 
运行 几 天 ， 几 周 甚至 几 个 月 ， 不 及 时 释放 内 存 也 可 能 导致 最 终 耗 尽 系统 的 所 有 内 存 。 所 以 ， 我 
们 称 这 类 内 存 泄 漏 为 隐 式 内 存 泄漏 。 


842 内存 泄漏 的 定义 


一 般 我 们 常 说 的 内 存 泄漏 是 指 堆 内 存 的 泄漏 。 堆 内 存 是 指 程序 从 堆 中 分 配 的 ， 大 小 任意 的 
(内 存 块 的 大 小 可 以 在 程序 运行 期 决定 )， 使 用 完 后 必须 显示 释放 的 内 存 。 应 用 程序 一 般 使 用 
malloc, realloc, new 等 函数 从 堆 中 分 配 到 一 块 内 存 ， 使 用 完 后 ， 程 序 必须 负责 相应 的 调用 free 
或 delete 释放 该 内 存 块 ， 否 则 ， 这 块 内 存 就 不 能 被 再 次 使 用 ， 我 们 就 说 这 块 内 存 泄漏 了 。 例 如 
下 面 的 这 段 小 程序 演示 了 扒 内 存 发 生 泄漏 的 情形 。 

void MyFunction(int nSize) ( 

char* p- new char[nSize]; 

if( !GetStringFrom( p, nSize ) ){ 

MessageBox ( “Error” ); 

return; ] 


} 


当 函 数 GetStringFromO 返 回 0 时 ， 指 针 p 指向 的 内 存 就 不 会 被 释放 。 这 是 一 种 常见 的 发 生 
内 存 泄 漏 的 情形 。 程 序 在 入 口 处 分 配 内 存 ， 在 出 口 处 释放 内 存 ， 但 是 0 函数 可 以 在 任何 地 方 退 
出 ， 所 以 一 旦 有 某 个 出 口 处 没有 释放 应 该 释放 的 内 存 ， 就 会 发 生 内 存 泄漏 。 


8.4.8 ”内 存 泄漏 的 常见 问题 和 后 果 


内 存 泄漏 会 因为 减少 可 用 内 存 的 数量 从 而 降低 计算 机 的 性 能 。 在 最 糟糕 的 情况 下 ， 过 多 的 
可 用 内 存 被 分 配 掉 导致 全 部 或 部 分 设备 停止 正常 工作 ， 或 者 应 用 程序 崩溃 。 内 存 泄漏 可 能 不 严 
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重 ， 甚 至 能 够 通过 常规 的 手段 检测 出 来 。 在 现代 操作 系统 中 ， 一 个 应 用 程序 使 用 的 常规 内 存在 
程序 终止 时 被 释放 。 这 表示 一 个 短暂 运行 的 应 用 程序 中 的 内 存 泄漏 不 会 导致 严重 的 后 果 。 在 以 
下 情况 ， 内 存 泄 漏 会 导致 较 严重 的 后 果 。 

D 程序 运行 后 置之不理 , 并 且 随 着 时 间 的 流逝 会 消耗 越 来 越 多 的 内 存 ( 比 如 服务 器 上 的 后 
台 任 务 ， 尤 其 是 嵌入 式 系统 中 的 后 台 任务 ， 这 些 任务 可 能 被 运行 后 很 多 年 内 都 置 之 
不 理 )。 

新 的 内 存 被 频繁 地 分 配 ， 比 如 当 显 示 电 脑 游 戏 或 动画 视频 画面 时 。 

程序 能 够 请 求 未 被 释放 的 内 存 (如 共享 内 存 )， 甚 至 是 在 程序 终止 时 。 

泄漏 在 操作 系统 内 部 发 生 。 

泄漏 在 系统 关键 驱动 中 发 生 。 

内 存 非 常 有 限 ， 比 如 在 嵌入 式 系统 或 便携 设备 中 。 

当 运 行 于 一 个 终止 时 内 存 并 不 自动 释放 的 操作 系统 (如 AmigaOS) 之 上 ， 而 且 一 旦 丢失 
只 能 通过 重新 启动 来 恢复 。 

内 存 泄 漏 是 程式 设计 中 一 项 常见 错误 , 特别 是 使 用 没有 内 置 自动 垃圾 回收 的 编程 语言 , 如 C 
及 CH, 一般 情况 下 ， 内 存 泄漏 发 生 是 因为 不 能 存 取 动 态 分 配 的 内 存 。 目 前 有 相当 数量 的 调试 
工具 用 于 检测 不 能 存 取 的 内 存 ， 从 而 可 以 防止 内 存 泄漏 问题 ， 如 IBM Rational Purify. 
BoundsChecker、Valgrind、Insure++ 及 memwatch 都 是 为 C/C++ 程式 设计 亦 较 受 欢 迎 的 内 存 除 错 
工具 。 垃 圾 回收 则 可 以 应 用 到 任何 编程 语言 ， 而 C/C++ 也 有 此 类 函 式 库 。 

提供 自动 内 存 管 理 的 编程 语言 如 Java, VB. .NETCNET 内 存 泄漏) 以 及 LISP， 都 不 能 避免 
内 存 泄漏 。 例 如 ， 程 式 会 把 项 目 加 入 至 列表 ， 但 在 完成 时 没有 移 除 ， 如 同人 把 物件 丢 到 一 堆 物 
品 中 或 放 入 抽 层 内 ， 但 后 来 忘记 取 走 这 件 物品 一 样 。 内 存 管理 器 不 能 判断 项 目 是 否 会 再 被 存 取 ， 
除非 程序 做 出 一 些 指示 表明 不 会 再 被 存 取 。 

虽然 内 存 管理 器 可 以 回复 不 能 存 取 的 内 存 ， 但 它 不 可 以 释放 可 存 取 的 内 存 因 为 仍 有 可 能 需 
要 使 用 。 现代 的 内 存 管理 器 因此 为 程序 设计 员 提供 技术 来 标示 内 存 的 可 用 性 ， 以 不 同 级 别 的 “ 存 
取 性 ”表示 。 内 存 管理 器 不 会 把 需要 存 取 可 能 较 高 的 对 象 释放 。 当 对 象 直接 和 一 个 强 引用 相关 
或 者 间接 和 一 组 强 引 用 相关 表示 该 对 象 存 取 性 较 强 。( 强 引用 相对 于 弱 引 用 ， 是 防止 对 象 被 回收 
的 一 个 引用 。) 要 防止 此 类 内 存 泄漏 ， 开 发 人 员 必 须 使 用 对 象 后 清理 引用 ， 一 般 都 是 在 不 再 需要 
时 将 引用 设 成 null， 如 果 有 可 能 ， 把 维持 强 引用 的 事件 侦 听 器 全 部 注销 。 

一 般 来 说 ， 自 动 内 存 管 理 对 开发 者 来 讲 比较 方便 ， 因 为 他 们 不 需要 实现 释放 的 动作 ， 或 担 
心 清理 内 存 的 顺序 ， 而 不 用 考虑 对 象 是 否 依然 被 引用 。 对 开发 人 员 来 说 ， 了 解 一 个 引用 是 否 有 
必要 保持 比 了 解 一 个 对 象 是 否 被 引用 要 简单 得 多 。 但 是 ， 自 动 内 存 管 理 不 能 消除 所 有 的 内 容 
泄漏 。 

如 果 一 个 程序 存在 内 存 泄漏 并 且 它 的 内 存 使 用 量 稳定 增长 ， 通 常 不 会 有 很 快 的 症状 。 每 个 
物理 系统 都 有 一 个 较 大 的 内 存量 ,如 果 内 存 泄漏 没有 被 中 止 (比如 重启 造成 泄漏 的 程序 )， 它 迟早 
会 造成 问题 。 大 多 数 的 现代 计算 机 操作 系统 都 有 存储 在 RAM 芯片 中 主 内 存 和 存储 在 次 级 存储 设 
备 如 硬盘 中 的 虚拟 内 存 ， 内 存 分 配 是 动态 的 一 一 每 个 进程 根据 要 求 获得 相应 的 内 存 。 存 取 活 跃 
的 页 面 文件 被 转移 到 主 内 存 以 提高 存 取 速 度 ， 反 之 ， 存 取 不 活跃 的 页 面 文件 被 转移 到 次 级 存储 
设备 。 当 一 个 简单 的 进程 消耗 大 量 的 内 存 时 ， 它 通常 占用 越 来 越 多 的 主 内 存 ， 使 其 他 程序 转 到 
次 级 存储 设备 ， 使 系统 的 运行 效率 大 大 降低 。 甚 至 在 有 内 存 泄 漏 的 程序 终止 后 ， 其 他 程序 需要 
相当 长 的 时 间 才 能 切换 到 主 内 存 ， 恢 复原 来 的 运行 效率 。 


@> 
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当 系统 所 有 的 内 存 全 部 耗 完 后 (包括 主 内 存 和 虚拟 内 存 ， 在 嵌入 式 系统 中 , 仅 有 主 内 存 )， 所 
有 申请 内 存 的 操作 将 失败 。 这 通常 导致 程序 试图 申请 内 存 来 终止 自己 ， 或 造成 分 段 内 存 访 问 错 
误 (segmentation fault)。 现 在 有 一 些 专门 为 修复 这 种 情况 而 设计 的 程序 ， 常 用 的 办 法 是 预 留 一 些 
内 存 。 值 得 注意 的 是 ， 第 一 个 遭遇 得 不 到 内 存 问 题 的 程序 有 时 候 并 不 是 有 内 存 泄漏 的 程序 。 一 
些 多 任务 操作 系统 有 特殊 的 机 制 来 处 理 内 存 耗 尽 的 情况 ， 如 随机 终止 一 个 进程 (可 能 会 终止 一 些 
正常 的 进程 )， 或 终止 耗 用 内 存 最 大 的 进程 (很 有 可 能 是 引起 内 存 泄漏 的 进程 )。 另 一 些 操作 系统 
则 有 内 存 分 配 限制 ， 这 样 可 以 防止 任何 一 个 进程 耗 用 完整 个 系统 的 内 存 。 这 种 设计 的 缺点 是 有 
时 候 某 些 进程 确实 需要 较 大 数量 的 内 存 时 ， 如 一 些 处 理 图 像 ， 视 频 和 科学 计算 的 进程 ， 操 作 系 
统 需 要 重新 配置 。 如 内 存 泄漏 发 生 在 内 核 ， 表 示 操 作 系 统 自 身 发 生 了 问题 。 那 些 没有 完善 的 内 
存 管理 的 计算 机 ， 如 嵌入 式 系统 ， 会 因为 一 个 长 时 间 的 内 存 泄漏 而 崩溃 。 一 些 被 公众 访问 的 系 
统 ， 如 网 络 服务 器 或 路 由 器 很 容易 被 黑客 攻击 ， 加 入 一 段 攻击 代码 ， 从 而 产生 内 存 泄漏 。 


8.4.4 检测 内 存 泄漏 


检测 内 存 泄漏 的 关键 是 要 能 截获 住 对 分 配 内 存 和 释放 内 存 的 函数 的 调用 。 截 获 住 这 两 个 函 
数 ， 就 能 跟踪 每 一 块 内 存 的 生命 周期 ， 比 如 每 当成 功 的 分 配 一 块 内 存 后 ， 就 把 它 的 指针 加 入 一 
个 全 局 的 list 中 ; 每 当 释放 一 块 内 存 ， 就 把 它 的 指针 从 list 中 删除 。 这 样 当 程 序 结束 时 ，list 中 
剩余 的 指针 就 是 指向 那些 没有 被 释放 的 内 存 。 如 果 要 检测 堆 内 存 的 泄漏 ， 那 么 只 需 截获 住 
malloc/realloc/free 和 new/delete 即 可 。 其 实 new/delete 最 终 也 是 用 malloc/free 的 ， 所 以 只 要 截获 
前 面 一 组 即 可 。 对 于 其 他 的 泄漏 ， 可 以 采用 类 似 的 方法 ， 截 获 住 相应 的 分 配 和 释放 函数 。 比 如 
要 检测 BSTR 的 泄漏 ， 就 需要 截获 “SysAllocString/SysFreeString”; 要 检测 HMENU 的 泄漏 ， 
就 需要 截获 “CreateMenu/ DestroyMenu”。 但 是 有 的 资源 的 分 配 函数 有 多 个 ， 释 放 函 数 只 有 一 
个 ,比如 SysAllocStringLen 也 可 以 用 来 分 配 BSTR, 这 时 就 需要 截获 多 个 分 配 函 数 。 在 Windows 
FAF, 检测 内 存 泄漏 的 工具 常用 的 一 般 有 三 种 ，MS C-Runtime Library 内 建 的 检测 功能 ; 外挂 
式 的 检测 工具 有 Purify, BoundsChecker 等 。 这 三 种 工具 各 有 优 缺 点，MS C-Runtime Library H 
然 在 功能 上 较 之 外 挂 式 的 工具 要 弱 ， 但 是 它 是 免费 的 ，Performance Monitor 虽然 无 法 标示 出 发 
生 问 题 的 代码 ， 但 是 它 能 检测 出 隐 式 的 内 存 泄 漏 的 存在 ， 这 是 其 他 两 类 工具 无 能 为 力 的 地 方 。 


8.5 Davlik 虚拟 机 的 内 存 分 配 


经 过 本 章 前 面 内 容 的 学 习 ， 读 者 已 经 简要 了 解 了 Java 虚拟 机 的 基本 知识 。 接 下 来 的 Davlik 
内 存 管理 的 基本 知识 就 比较 简单 了 ， 因 为 两 者 的 基本 原理 相似 。 接 下 来 将 详细 讲解 Davlik 虚拟 
机 的 基本 知识 。 

Dalvik 虚拟 机 是 Google 公司 在 Android 平台 上 的 Java 虚拟 机 的 实现 ， 内 存 管理 是 Dalvik 
虚拟 机 中 的 一 个 重要 组 件 。 从 概念 上 来 说 ， 内 存 管理 的 核心 就 是 两 个 部 分 : 分 配 内 存 和 回收 内 
ff. Java 语言 使 用 new 操作 符 来 分 配 内 存 ， 但 是 与 C/C++ 等 语言 不 同 的 是 ，Java 语言 并 没有 提 
供 任 何 操作 来 释放 内 存 ， 而 是 通过 一 种 叫 作 垃圾 收集 的 机 制 来 回收 内 存 。 对 于 内 存 管理 的 实现 ， 
我 们 通过 如 下 三 个 方面 来 加 以 分 析 。 

Q WR. 

Q 内 存 回 收 。 
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Q PER. 

本 节 将 分 析 Dalvik 虚拟 机 是 如 何 分 配 内 存 的 。 

(1) 对 象 布局 

内 存 管理 的 主要 操作 之 一 是 为 Java 对 象 分 配 内 存 ，Java 对 象 在 虚拟 机 中 的 内 存 布局 如 
图 8-10 所 示 。 

所 有 的 对 象 都 有 一 个 相同 的 头 部 clazz 和 lock。 

(D clazz: 指向 该 对 象 的 类 对 象 ， 类 对 象 用 来 描述 该 对 象 所 属 的 类 ， 这 样 可 以 很 容易 地 从 
一 个 对 象 获取 该 对 象 所属 的 类 的 具体 信息 。 

© lock: 是 一 个 无 符号 整数 ， 用 以 实现 对 象 的 同步 。 

© data: 用 于 存放 对 象 数 据 ， 根 据 对 象 的 不 同 数据 区 的 大 小 是 不 同 的 。 

(2) HE 

堆 是 Dalvik 虚拟 机 从 操作 系统 分 配 的 一 块 连续 的 虚拟 内 存 ,如 图 8-11 所 示 。 其 中 heapBase 
表示 堆 的 起 始 地 址 ，heapLimit 表示 堆 的 最 大 地 址 ， 堆 大 小 的 最 大 值 可 以 通过 “-Xmx” 选 项 或 
dalvik.vm.heapsize 指定 。 在 原生 系统 中 ,一 般 dalvik.vm.heapsize 值 是 32MB, 在 MIUI 中 我 们 将 
其 设 为 64MB。 


heapLimit 


heapBase 
图 8-10 内存 布局 图 8-11 堆 结构 


(3) 堆 内 存 位 图 

在 虚拟 机 中 维护 了 两 个 对 应 于 堆 内 存 的 位 图 ， 称 为 liveBits 和 markBits。 在 对 象 布局 中 , 我 
们 看 到 对 象 最 小 占用 8B。 在 为 对 象 分 配 内 存 时 要 求 必须 8B 对 齐 。 这 也 就 是 说 ， 对 象 的 大 小 会 
调整 为 8B 的 倍数 。 比 如 说 一 个 对 象 的 实际 大 小 是 13B， 但 是 在 分 配 内 存 时 分 配 16B。 因 此 所 有 
对 象 的 起 始 地 址 一 定 是 SB 的 倍数 。 堆 内 存 位 图 就 是 用 来 描述 堆 内 存 的 ， 每 一 个 bit 描述 8 个 字 
节 ， 因 此 堆 内 存 位 图 的 大 小 是 对 的 64 分 之 一 。 对 于 MIUI 的 实现 来 说 ， 这 两 个 位 图 各 占 IMB. 

liveBits 的 功能 是 跟踪 堆 中 以 分 配 的 内 存 ， 每 分 配 一 个 对 象 时 ， 对 象 的 内 存 起 始 地 址 对 应 于 
位 图 中 的 位 被 设 为 1。 在 下 一 章 垃圾 收集 中 我 们 会 进一步 分 析 liveBits 和 markBits 这 两 个 位 图 的 
作用 。 

(4) 堆 的 内 存 管理 

在 Dalvik 虚拟 机 的 实现 中 , 是 通过 底层 的 bionicC 库 的 malloc/free 操作 来 分 配 / 释 放 内 存 的 。 
FE bionicC 的 “malloc/free” 操 作 是 基于 DougLea 的 实现 (dlmalloc)， 这 是 一 个 被 广泛 使 用 ， 久 经 
考验 的 C 内 存 管理 库 。 有 关 库 dlmalloc 的 基本 知识 ， 读 者 可 以 参阅 相关 的 资料 。 

(5) dvmAllocObject 

在 Dalvik 虚拟 机 中 ， 操 作 符 new 最 终 对 应 c 函数 dvmAllocObject0。 下 面 通过 伪 码 的 形式 
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列 出 dvmAllocObject 的 实现 。 


Object*dvmAllocObject(ClassObject *clazz, int flags) { 
n - get object size form class object clazz 
first try: allocate n bytes from heap 
if first try failed [ 
run garbage collector without collecting soft references 
second try: allocate n bytes from heap 


} 
if second try failed { 
third try: grow the heap and allocate n bytes from heap 
// 堆 是 虚拟 内 存 ， 一 开始 并 未 分 配 所 有 的 物理 内 存 ， 只 要 还 没有 达到 虚拟 内 存 的 最 大 值 ， 可 以 通过 获取 更 多 物理 内 存 
的 方式 来 扩展 堆 
} 
if third try failed { 
run garbage collector with collecting soft references 
fourth try: grow the hap and allocate n bytes from heap 


} 


if fourth try failed, return null pointer, dalvik vm will abort 

} 

由 此 可 以 看 出 ， 为 了 分 配 内 存 ， 虚 拟 机 尽 了 最 大 的 努力 ， 做 了 4 次 尝试 。 其 中 进行 了 2 次 
垃圾 收集 ， 第 1 次 不 收集 SoftReference， 第 2 次 收集 SoftReference。 从 中 也 可 以 看 出 垃圾 收集 
的 时 机 ， 实 质 上 在 Dalvik 虚拟 机 实现 中 有 3 个 时 机 可 以 触发 垃圾 收集 的 运行 。 

口 程序 员 显 式 地 调用 Systeme). 

口 内 存 分 配 失败 时 。 

口 ” 如 果 分 配 的 对 象 大 小 超过 384KB， 运 行 并 发 标记 (concurrent mark) 

综 上 所 述 ， 在 Dalvik 虚拟 机 中 ， 内 存 分 配 操作 的 流程 相对 比较 简单 直观 ， 从 一 个 堆 中 分 配 
可 用 内 存 ， 分 配 失败 时 会 触发 垃圾 收集 。 


86 分 析 Dalvik 虚拟 机 的 内 存 管理 机 制 源码 


Dalvik 虚拟 机 的 内 存 管理 需要 依赖 于 Linux 的 内 存 管 理 机 制 ，Dalvik 虚拟 机 的 内 存 管 理 的 
实现 源码 保存 在 “vm\alloc” 目 录 中 。 本 节 将 通过 对 源码 的 分 析 来 简要 讲解 Dalvik 虚拟 机 内 存 管 
理 机 制 的 基本 知识 。 


8.6.1 表示 堆 的 结构 体 
在 文件 HeapSource.c 中 定义 表示 堆 的 结构 体 ， 其 源码 如 下 。 


typedef struct { 
/* 使 用 dlmalloc 分 配 的 内 存 
o 


mspace *msp; 


HeapBitmap objectBitmap; 


< 多 


LESS Android 虚拟 机 ~ 


/* 堆 可 以 增长 的 最 大 值 
size t absoluteMaxSize; 


/* 已 分 配 的 字 节 数 
x 
size_t bytesAllocated; 


/* 已 分 配 的 对 象 数 

xU 

size t objectsAllocated; 
) Heap; 


8.6.2 ”表示 位 图 堆 的 结构 体 数据 


在 文件 HeapBitmap.h 中 定义 表示 位 图 堆 的 结构 体 数据 ， 其 源码 如 下 。 
typedef struct { 
/* 位 图 数据 
*/ 
unsigned long int *bits; 


/* 位 图 的 大 小 
size t bitsLen; 


/* 位 图 对 应 的 对 象 指针 数组 的 首 地 址 
uintptr t base; 


/* 位 图 使 用 中 的 最 后 一 位 被 设置 的 对 象 指针 地 址 ， 如 果 全 没 设置 则 (max < base) 
x7, 
uintptr t max; 

} HeapBitmap; 


8.6.3 HeapSource 结构 体 


在 Dalvik 虚拟 机 中 ,使 用 结构 体 HeapSource 来 管理 各 种 Heap 数据 ，Heap 只 是 其 中 的 一 个 
子 项 ， 其 源码 在 文件 HeapSource.c 中 定义 。 
struct HeapSource { 
/* 堆 的 使 用 率 ， 范 围 从 1 f| HEAP UTILIZATION MAX 
a 
Size t targetUtilization; 


/* 分 配 堆 的 最 小 尺寸 
E 
size t minimumSize; 


/* 堆 分 配 的 初始 尺寸 
c 
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size t startSize; 


/* 允许 分 配 的 堆 增长 到 的 最 大 尺寸 
E 
size t absoluteMaxSize; 


/* 理想 的 堆 的 最 大 尺寸 
xj 


size_t idealSize; 


/* 在 垃圾 收集 前 允许 堆 分 配 的 最 大 尺寸 
Lp 


size t softLimit; 


/* 堆 数 组 ， 最 大 尺寸 为 3 
* 
/ 
Heap heaps [HEAP SOURCE MAX HEAP COUNT]; 


/* 当前 堆 的 个 数 
EJ 
size_t numHeaps; 


/* 对 外 分 配 计数 
m 
size_t externalBytesAllocated; 


/* 人 允许 外 部 分 配 的 最 大 值 
t/ 


size_t externalLimit; 


/* 在 创建 这 个 HeapSource 的 时 候 是 否 是 zygote 模式 ， 确 定 是 否 有 zygote 进程 
ie) 
bool sawZygote; 


h 
8.6.4 和 mark bits 相关 的 结构 体 


在 文件 MarkSweep.h 中 定义 了 和 mark bits 相关 的 结构 体 ， 其 源码 如 下 。 
typedef struct { 

/* 允许 增长 到 的 最 低地 址 

*/ 

const Object **limit; 


const Object **top; 


/* BUR 

call 

const Object **base; 
} GcMarkStack; 


«a 
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typedef struct { 
/* 存放 位 图 的 数组 

ey 

HeapBitmap bitmaps[HEAP SOURCE MAX HEAP COUNT]; 
/* 位 图 数 

s) 

size_t numBitmaps; 
/* ac 标记 栈 

m 

GcMarkStack stack; 
/* 存放 地 址 上 限 的 标志 

eu 

const void *finger;  // only used while scanning/recursing. 
) GcMarkContext ; 


8.6.5 ”结构 体 GcHeap 


在 文件 HeapInternal.h 中 定义 了 Dalvik 的 垃圾 回收 机 制 需要 用 到 结构 体 GcHeap， 其 源码 
如 下 。 


struct GcHeap { 
/* HeapSource 结构 ， 包 含 了 所 有 的 堆 数 据 */ 


HeapSource *heapSource; 
/* 存储 不 能 被 垃圾 回收 对 象 的 参考 表 
Id nonCollectableRefs; 
/* 存 储 一 些 当 被 垃圾 回收 时 需要 执行 finalization 方法 的 参考 表 
* 


if 
LargeHeapRefTable *finalizableRefs; 


/* 存 储 需要 执行 finalization 方法 的 对 象 的 参考 表 
e 
LargeHeapRefTable *pendingFinalizationRefs; 


/* 软 引用 对 象 列表 
a 
Object *softReferences; 
/* 弱 引用 对 象 列表 
2) 
Object *weakReferences; 
影子 引用 对 象 列 表 
E 
Object *phantomReferences; 


* 


i 


/* 需要 被 执行 clear 或 enqueue 方法 的 引用 对 象 列表 
oy! 
LargeHeapRefTable *referenceOperations; 
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/* 如 果 对 象 不 为 空 ， 则 表示 HeapWorker 线程 正在 执行 
* executing. 
EU 

Object *heapWorkerCurrentObject; 

Method *heapWorkerCurrentMethod; 


/* 如 果 heapWorkerCurrentObject 不 为 空 ， 表 示 HeapWorker 开始 执行 这 个 方法 的 时 间 
*/ 

u8 heapWorkerInterpStartTime; 

/* 如 果 heapWorkerCurrentObject 不 为 空 ， 表 示 HeapWorker CPU 开始 执行 这 个 方法 的 时 间 
*/ 

u8 heapWorkerInterpCpuStartTime; 


/* 下 一 次 裁剪 Heap Source 的 时 间 
*/ 


struct timespec heapWorkerNextTrim; 


/* 标记 步骤 中 的 状态 
* 
/ 
GcMarkContext markContext; 


/* GC 开始 的 时 间 
u8 gcStartTime; 
/* 是 否 正在 执行 GC 
qu 
bool gcRunning; 


/* GC 时 引用 对 象 回收 多 少 

* 不 回收 ， 回 收 一 半 ， 全 部 回收 

i 

enum ( SR COLLECT NONE, SR COLLECT SOME, SR COLLECT ALL ) 
softReferenceCollectionState; 


/* 存在 多 少 软 引用 对 象 时 开始 回收 引用 对 象 
E 


size t softReferenceHeapSizeThreshold; 


/* 当 软 引 用 回收 策略 为 回收 一 半 时 使 用 的 概率 值 


en 
int softReferenceColor; 
/* 引用 收集 策略 

A 
bool markAllReferents; 


dif DVM TRACK HEAP MARKING 
/* Every time an unmarked object becomes marked, markCount 
* is incremented and markSize increases by the size of 
* that object. 
s 


<B 


= 
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size t markCount ; 
size t markSize; 
#endif 


/* 下 面 是 和 调试 相关 的 信息 


x 
int ddmHpifWhen; 
int ddmHpsgWhen; 
int ddmHpsgWhat ; 
int ddmNhsgWhen ; 
int ddmNhsgWhat ; 


dif WITH HPROF 


bool hprofDumpOnGc ; 

const char* hprofFileName; 

hprof_context_t *hprofContext; 

int hprofResult; 
#endif 


h 
8.6.6 初始 化 垃圾 回收 器 


在 文件 Init.c 中 ， 通 过 函数 dvmGcStartup0 来 初始 化 垃圾 回收 器 。 
bool dvmGcStartup (void) 


{ 


dvmInitMutex (&gDvm.gcHeapLock) ; 
return dvmHeapStartup () ; 


8.6.7 ”初始 化 和 Heap 相关 的 信息 


在 文件 alloc\Heap.c 中 ， 通 过 dvmHeapStartupO 函 数 来 初始 化 和 Heap 相关 的 信息 ， 例 如 党 
见 的 内 存 分 配 和 内 存 管 理 等 工作 。 其 源码 如 下 。 


bool dvmHeapStartup () 


{ 
GcHeap *gcHeap; 
#if defined(WITH ALLOC LIMITS) 
gDvm.checkAllocLimits - false; 
gDvm.allocationLimit - -1; 
#endif 
gcHeap = dvmHeapSourceStartup (gDvm.heapSizeStart, gDvm.heapSizeMax) ; 
if (gcHeap == NULL) { 
return false; 


} 
gcHeap->heapWorkerCurrentObject = NULL; 
gcHeap->heapWorkerCurrentMethod = NULL; 


gcHeap->heapWorkerInterpStartTime = OLL; 
gcHeap->softReferenceCollectionState = SR_COLLECT_NONE; 
gcHeap->softReferenceHeapSizeThreshold = gDvm.heapSizeStart; 
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gcHeap->ddmHpifWhen 
gcHeap->ddmHpsgWhen 
gcHeap->ddmHpsgWhat 
gcHeap->ddmNhsgWhen 
gcHeap->ddmNhsgWhat 


#if WITH HPROF 


gcHeap-»hprofDumpOnGc = false; 
gcHeap->hprofContext = NULL; 


#endif 


/* This needs to be set before we call dvmHeapInitHeapRefTable() . 

» 

gDvm.gcHeap - gcHeap; 

/* Set up the table we'll use for ALLOC NO GC. 

$7 

if (!dvmHeapInitHeapRefTable (&gcHeap->nonCollectableRefs, 
kNonCollectableRefDefault)) 

{ 


LOGE HEAP("Can't allocate GC NO ALLOC table/n") ; 
goto fail; 
} 
/* Set up the lists and lock we'll use for finalizable 
* and reference objects. 
Cf 
dvmInitMutex (&gDvm.heapWorkerListLock) ; 
gcHeap->finalizableRefs = NULL; 
gcHeap->pendingFinalizationRefs = NULL; 
gcHeap->referenceOperations = NULL; 
/* Initialize the HeapWorker locks and other state 
* that the GC uses. 
a 
dvmInitializeHeapWorkerState () ; 
return true; 


fail: 


gDvm.gcHeap - NULL; 
dvmHeapSourceShutdown (gcHeap) ; 
return false; 


8.6.8 创建 GcHeap 


在 文件 alloc\HeapSource.c 4 


如 下 。 


GcHeap * 
dvmHeapSourceStartup(size t startSize, size t absoluteMaxSize) 


{ 


GcHeap *gcHeap; 
HeapSource *hs; 
Heap *heap; 
mspace msp; 


Ph， 通 过 函数 dvmHeapSourceStartup0 来 创建 GcHeap。 其 源码 
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assert (gHs NULL); 


if (startSize > absoluteMaxSize) { 
LOGE ("Bad heap parameters (start=%d, max=%d)\n", 
startSize, absoluteMaxSize) ; 
return NULL; 


} 


/* Create an unlocked dlmalloc mspace to use as 
* the small object heap source. 
S 
msp - createMspace(startSize, absoluteMaxSize, 0); 
if (msp -- NULL) { 
return false; 
} 


/* Allocate a descriptor from the heap we just created. 


ui 

gcHeap = mspace malloc(msp, sizeof (*gcHeap) ) ; 

if (gcHeap NULL) { 
LOGE_HEAP("Can't allocate heap descriptor\n") ; 
goto fail; 


} 


memset (gcHeap, 0, sizeof (*gcHeap) ) ; 


hs = mspace malloc(msp, sizeof (*hs) ); 

if (hs == NULL) { 
LOGE HEAP("Can't allocate heap source\n") ; 
goto fail; 


) 


memset(hs, 0, sizeof(*hs)); 


hs-»targetUtilization - DEFAULT HEAP UTILIZATION; 
hs-»minimumSize - 0; 
hs-»startSize - startSize; 
hs-»absoluteMaxSize - absoluteMaxSize; 
hs-»idealSize - startSize; 
hs-»softLimit - INT MAX; // no soft limit at first 
hs-»numHeaps - 0; 
hs-»sawZygote - gDvm.zygote; 
if (!addNewHeap(hs, msp, absoluteMaxSize)) { 
LOGE_HEAP("Can't add initial heap\n") ; 
goto fail; 


} 
gcHeap->heapSource = hs; 


countAllocation(hs2heap(hs), gcHeap, false) ; 
countAllocation(hs2heap(hs), hs, false); 


gHs = hs; 
return gcHeap; 
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fail: 
destroy contiguous mspace (msp); 
return NULL; 

} 


8.6.9 追踪 位 置 


在 文件 alloc\HeapSource.c 中 ,通过 函数 countAllocation()7E Heap::obiect Bitmap 上 进行 标记 ， 
以 便 追 踪 这 些 区 域 的 位 置 。 其 源码 如 下 。 


static inline void 
countAllocation (Heap *heap, const void *ptr, bool isobj) 


{ 


assert (heap->bytesAllocated < mspace footprint (heap-»msp)); 


heap->bytesAllocated += mspace usable size(heap->msp, ptr) + 
HEAP SOURCE CHUNK OVERHEAD; 
if (isObj) ( 
heap->objectsAllocated++; 
// 标 记 回收 
dvmHeapBitmapSetObjectBit (&heap->objectBitmap, ptr); 


) 
assert (heap->bytesAllocated < mspace footprint (heap-»msp)); 
} 
HB_INLINE_PROTO( 
bool 
dvmHeapBitmapMayContainObject (const HeapBitmap *hb, 
const void *obj) 
) 
{ 
const uintptr_t p = (const uintptr_t)obj; 
assert ((p & (HB OBJECT ALIGNMENT - 1)) == 0); 
return p »- hb-»base && p «- hb-»max; 
} 
HB INLINE PROTO( 
bool 
dvmHeapBitmapCoversAddress(const HeapBitmap *hb, const void *obj) 
) 
{ 
assert (hb !- NULL); 
if (obj !- NULL) { 
const uintptr t offset - (uintptr t)obj - hb-»base; 
const size t index = HB OFFSET TO INDEX (offset); 
return index < hb-»bitsLen / sizeof(*hb-»bits); 
) 
return false; 
} 
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8.6.10 ”实现 空间 分 配 
在 文件 Heap.c 中 ， 通 过 函数 dvmMalloc0 实 现 空间 的 分 配 工 作 。 其 源码 如 下 。 


void* dvmMalloc (size t size, int flags) 
{ 
GcHeap *gcHeap = gDvm.gcHeap; 
DvmHeapChunk *hc; 
void *ptr; 
bool triedGc, triedGrowing; 


gif 0 
/* handy for spotting large allocations */ 
if (size »- 100000) { 
LOGI ("dvmMalloc(%d):\n", size); 
dvmDumpThread (dvmThreadSelf(), false) ; 
) 


#endif 


#if defined (WITH ALLOC LIMITS) 
/* 
See if they've exceeded the allocation limit for this thread. 


A limit value of -1 means "no limit". 


TLS lookup for the Thread pointer. This has enough of a performance 
impact that we don't want to do it if we don't have to. (Now that 
we're using gDvm.checkAllocLimits we may want to reconsider this, 
but it's probably still best to just compile the check out of 
production code -- one less thing to hit on every allocation.) 
e 
if (gDvm.checkAllocLimits) { 
Thread* self - dvmThreadSelf(); 
if (self !- NULL) { 
int count - self-»allocLimit; 
if (count > 0) { 
self->allocLimit--; 
} else if (count == 0) { 
/* fail! */ 
assert(!gDvm.initializing); 
self->allocLimit = -1; 
dvmThrowException ("Ldalvik/system/AllocationLimitError;", 
"thread allocation limit exceeded"); 
return NULL; 


* 
* 
* 
* 
* This is enabled at compile time because it requires us to do a 
* 
* 
* 
* 
* 


} 


if (gDvm.allocationLimit >= 0) { 
assert (!gDvm.initializing) ; 
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gDvm.allocationLimit = -1; 

dvmThrowException ("Ldalvik/system/AllocationLimitError;", 
"global allocation limit exceeded") ; 

return NULL; 


} 


#endif 
dvmLockHeap () ; 


/* Try as hard as possible to allocate some memory. 
M 
hc - tryMalloc(size); 
if (hc !- NULL) { 
alloc succeeded: 

/* We've got the memory. 

el 

if ((flags & ALLOC FINALIZABLE) != 0) { 

/* This object is an instance of a class that 
overrides finalize(). Add it to the finalizable list. 


* 

* 

* Note that until DVM OBJECT INIT() is called on this 

* object, its clazz will be NULL. Since the object is 

* in this table, it will be scanned as part of the root 

* set. scanObject() explicitly deals with the NULL clazz. 

if (!dvmHeapAddRefToLargeTable (&gcHeap-»finalizableRefs, 
(Object *)hc-»data)) 


{ 
LOGE HEAP("dvmMalloc(): no room for any more " 
"finalizable objects Wn") ; 
dvmAbort () ; 
} 


} 


#if WITH OBJECT HEADERS 
hc-»header = OBJECT HEADER; 
hc-»birthGeneration - gGeneration; 
#endif 
ptr = hc-»data; 


/* The caller may not want us to collect this object. 
If not, throw it in the nonCollectableRefs table, which 
will be added to the root set when we GC. 


Note that until DVM_OBJECT_INIT() is called on this 
object, its clazz will be NULL. Since the object is 

in this table, it will be scanned as part of the root 
set. scanObject() explicitly deals with the NULL clazz. 


* 0*0 0X ee 


E 
if ((flags & ALLOC NO GC) !- 0) { 


if (!dvmHeapAddToHeapRefTable (&gcHeap-»nonCollectableRefs, ptr)) { 


LOGE HEAP("dvmMalloc(): no room for any more " 
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"ALLOC NO GC objects: %zd\n", 
dvmHeapNumHeapRefTableEntries ( 
&gcHeap->nonCollectableRefs) ) ; 
dvmAbort () ; 


} 


#ifdef WITH_PROFILER 
if (gDvm.allocProf.enabled) { 

Thread* self = dvmThreadSelf () ; 

gDvm.allocProf .allocCount++; 

gDvm.allocProf.allocSize += size; 

if (self != NULL) { 
self->allocProf .allocCount++; 
self->allocProf.allocSize += size; 


} 
} 
#endif 
} else { 
/* The allocation failed. 
Eu 
ptr = NULL; 


#ifdef WITH PROFILER 
if (gDvm.allocProf.enabled) { 

Thread* self - dvmThreadSelf(); 

gDvm.allocProf .failedAllocCount++; 

gDvm.allocProf.failedAllocSize += size; 

if (self !- NULL) { 
self->allocProf.failedAllocCount++; 
self->allocProf.failedAllocSize += size; 


} 
} 
#endif 
} 
dvmUnlockHeap () ; 


if (ptr != NULL) { 
/* 
* If this block is immediately GCable, and they haven't asked us not 


* to track it, add it to the internal tracking list. 

* 

* If there's no "self" yet, we can't track it. Calls made before 
* the Thread exists should use ALLOC NO GC. 

S 


if ((flags & (ALLOC DONT TRACK | ALLOC NO GC)) == 0) { 
dvmAddTrackedAlloc(ptr, NULL); 
} 
} else { 
/* 
* The allocation failed; throw an OutOfMemoryError. 
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x 
throwOOME () ; 


} 


return ptr; 


} 
上 述 具 体 分 配 过 程 由 tryMalloc 控制 ， 具 体 执行 流程 如 下 。 
tryMalloc () -gcForMalloc() -dvmCollectGarbageInternal () 


当 满足 条 件 时 ， 会 调用 dvmCollectGarbageInternal0 进 行 垃圾 回收 。 


8.6.11 其 他 模块 


在 文件 alloc\MarkSweep.c 中 ， 通 过 函数 dvmHeapScanMarkedObjects0 根 据 上 一 个 函数 给 出 
的 根 对 象 位 图 ， 对 每 一 个 根 相 关 的 位 图 进行 计算 ， 如 果 这 个 根 对 象 有 被 引用 ， 就 标记 为 使 用 。 
这 个 过 程 是 递归 调用 的 过 程 ， 从 根 开始 不 断 重 复 地 对 子 树 进 行 标 记 的 过 程 HK 
dvmHeapScanMarkedObjects0 的 源码 如 下 。 


void dvmHeapScanMarkedObjects () 


{ 


GcMarkContext *ctx = &gDvm.gcHeap->markContext; 
assert (ctx->finger == NULL); 


/* The bitmaps currently have bits set for the root set. 
* Walk across the bitmaps and scan each object. 
xA 
#ifndef NDEBUG 
gLastFinger - 0; 
#endif 
dvmHeapBitmapWalkList (ctx->bitmaps, ctx->numBitmaps, 


scanBitmapCallback, ctx); 


/* We've walked the mark bitmaps. Scan anything that's 
* left on the mark stack. 
* 


processMarkStack (ctx) ; 


LOG SCAN("done with marked objects\n"); 
} 
函数 dvmHeapScanMarkedObijects0 是 通过 函数 dvmHeapBitmapWalkListO 进 行 第 一 轮 扫描 ， 
针对 dvmHeapMarkRootSet() 已 标记 的 object 。dvmHeapBitmapWalkListO 会 呼叫 一 个 参数 传 入 
的 callback, 将 扫描 新 发 现 的 object 加 入 到 一 个 stack "i. 
函数 dvmHeapBitmapWalkList0 在 文件 中 alloc\HeapBitmap.c 实现 ， 其 源码 如 下 。 
bool dvmHeapBitmapWalkList (const HeapBitmap hbs[], size t numBitmaps, 


bool (*callback) (size t numPtrs, void **ptrs, 
const void *finger, void *arg), 
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DE 
void *callbackArg) 


size t indexList [numBitmaps] ; 
size t i; 


/* Sort the bitmaps by address. 
o 
createSortedBitmapIndexList (hbs, numBitmaps, indexList); 


/* Walk each bitmap, lowest address first. 
SA 
for (i = 0; i < numBitmaps; i++) { 
bool ok; 
ok = dvmHeapBitmapWalk(&hbs[indexList[i]], callback, callbackArg) ; 
if (lok) ( 
return false; 
} 


} 


return true; 


} 


dvmHeapScanMarkedObjects() 会 通过 processMarkStack() 处 理 stack 里 的 object 。 当 
processMarkStack() 处 理 stack 里 的 object IT, 新 发 现 的 物件 会 加 入 该 stack。processMarkStack() 
会 不 断 地 从 stack pop object， 并 监视 是 否 reference 未 标记 物件 ， 直 到 清空 stack。 

函数 processMarkStack0 是 在 文件 alloc\MarkSweep.c 中 实现 的 ， 其 源码 如 下 。 


tatic void 
processMarkStack(GcMarkContext *ctx) 


{ 


const Object **const base = ctx-»stack.base; 


/* Scan anything that's on the mark stack. 
* We can't use the bitmaps anymore, so use 
* a finger that points past the end of them. 
=) 
ctx-»finger = (void *)ULONG MAX; 
while (ctx-»stack.top !- base) ( 

scanObject (*ctx->stack.top++, ctx); 


} 
} 
监视 object 的 reference 是 由 文件 MarkSweep.c 里 的 函数 scanObject0 实 现 的 ,此 函数 会 检查 
object 的 每 一 个 栈 位 所 reference( 引 用 ) 的 物件 是 否 尚未 被 标记 。 函 数 scanObject0 的 实现 源码 
如 下 。 
static void scanObject(const Object *obj, GcMarkContext *ctx) 


{ 


ClassObject *clazz; 


assert (dvmIsValidObject (obj) ) ; 
LOGV SCAN("Oxt08x s\n", (uint)obj, obj-»clazz-»name); 
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#if WITH HPROF 
if (gDvm.gcHeap->hprofContext != NULL) { 
hprofDumpHeapObject (gDvm.gcHeap->hprofContext, obj); 
} 


#endif 


#if WITH OBJECT HEADERS 
if (ptr2chunk(obj)-»scanGeneration == gGeneration) { 
LOGE ("object 0x%08x was already scanned this generation\n", 
(uintptr_t) obj); 
dvmAbort () ; 
} 
ptr2chunk (obj) ->oldScanGeneration = ptr2chunk (obj) ->scanGeneration; 
ptr2chunk (obj) ->scanGeneration = gGeneration; 
ptr2chunk (obj) ->scanCount++; 
#endif 


/* Get and mark the class object for this particular instance. 
NA 
clazz = obj-»clazz; 
if (clazz == NULL) ( 
/* This can happen if we catch an object between 
* dvmMalloc() and DVM OBJECT INIT(). The object 
* won't contain any references yet, so we can 
* just skip it. 
S 
return; 
) else if (clazz == gDvm.unlinkedJavaLangClass) { 
/* This class hasn't been linked yet. We're guaranteed 
* that the object doesn't contain any references that 
* aren't already tracked, so we can skip scanning it. 
* 
* NOTE: unlinkedJavaLangClass is not on the heap, so 
* it's very important that we don't try marking it. 
zr 
return; 


} 


#if WITH OBJECT HEADERS 
gMarkParent - obj; 
#endif 


assert (dvmIsValidObject ((Object *)clazz)); 
markObjectNonNull( (Object *)clazz, ctx); 


/* Mark any references in this object. 
2) 
if (IS CLASS FLAG SET(clazz, CLASS ISARRAY)) [ 
/* It's an array object. 
E 
if (IS CLASS FLAG SET(clazz, CLASS ISOBJECTARRAY)) [ 
/* It's an array of object references. 
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scanObjectArray((ArrayObject *)obj, ctx); 
} 
// else there's nothing else to scan 
} else { 
/* It's a DataObject-compatible object. 
i 
scanInstanceFields((DataObject *)obj, clazz, ctx); 


if (IS CLASS FLAG SET(clazz, CLASS ISREFERENCE)) { 
GcHeap *gcHeap - gDvm.gcHeap; 
Object *referent; 


/* It's a subclass of java/lang/ref/Reference. 
* The fields in this class have been arranged 

* such that scanInstanceFields() did not actually 
* mark the "referent" field; we need to handle 

* it specially. 
* 
* 
* 


If the referent already has a strong mark (isMarked(referent)), 
we don't care about its reference status. 
af 
referent = dvmGetFieldObject (obj, 
gDvm.offJavaLangRefReference referent); 
if (referent !- NULL && 
lisMarked(ptr2chunk(referent), &gcHeap-»markContext)) 
{ 


u4 refFlags; 


if (gcHeap-»markAllReferents) { 
LOG REF("Hard-marking a reference\n") ; 


/* Don't bother with normal reference-following 
* behavior, just mark the referent. This should 
* only be used when following objects that just 
* became scheduled for finalization. 

s 

markObjectNonNull(referent, ctx); 

goto skip_reference; 


} 


/* See if this reference was handled by a previous GC. 
x/, 
if (dvmGetFieldObject (obj, 
gDvm.offJavaLangRefReference vmData) -- 
SCHEDULED REFERENCE MAGIC) 


LOG REF("Skipping scheduled reference\n") ; 
/* Don't reschedule it, but make sure that its 


* referent doesn't get collected (in case it's 
* a PhantomReference and wasn't cleared automatically). 
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* 
//TODO: Mark these after handling all new refs of 
LL this strength, in case the new refs refer 
FAA to the same referent. Not a very common 
LL case, though. 


markObjectNonNull(referent, ctx); 
goto skip_reference; 


/* Find out what kind of reference is pointing 

* to referent. 

He 

refFlags = GET_CLASS FLAG GROUP(clazz, 
CLASS_ISREFERENCE | 
CLASS_ISWEAKREFERENCE | 
CLASS_ISPHANTOMREFERENCE) ; 


/* We use the vmData field of Reference objects 

* as a next pointer in a singly-linked list. 

* That way, we don't need to allocate any memory 

* while we're doing a GC. 

x/ 

#define ADD REF TO LIST(list, ref) V 

do ( \ 
Object *ARTL ref = (/*de-const*/Object *) (ref); V 
dvmSetFieldObject(ARTL ref , V 

gDvm.offJavaLangRefReference vmData, list); V 

list = ARTL ref ; \ 

} while (false) 


/* At this stage, we just keep track of all of 
* the live references that we've seen. Later, 
* we'll walk through each of these lists and 
* deal with the referents. 
x, 
if (refFlags CLASS ISREFERENCE) { 
/* It's a soft reference. Depending on the state, 
* we'll attempt to collect all of them, some of 
* them, or none of them. 
eun 
if (gcHeap-»softReferenceCollectionState -- 
SR COLLECT NONE) 


{ 


sr_collect_none: 
markObjectNonNull (referent, ctx); 
} else if (gcHeap->softReferenceCollectionState == 
SR COLLECT ALL) 
{ 
sr_collect_all: 
ADD_REF_TO_LIST(gcHeap->softReferences, obj); 
} else { 
/* We'll only try to collect half of the 
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* referents. 

i 

if (gcHeap->softReferenceColor++ & 1) { 
goto sr collect none; 


} 
goto sr_collect_all; 
} 
} else { 
/* It's a weak or phantom reference. 
* Clearing CLASS_ISREFERENCE will reveal which. 
s7 
refFlags &= ~CLASS_ISREFERENCE; 
if (refFlags == CLASS_ISWEAKREFERENCE) { 
ADD_REF_TO_LIST (gcHeap->weakReferences, obj); 
} else if (refFlags == CLASS_ISPHANTOMREFERENCE) { 
ADD_REF_TO_LIST (gcHeap->phantomReferences, obj); 
} else { 
assert ( ! "Unknown reference type"); 
} 


} 


#undef ADD REF TO LIST 
} 
} 


skip_reference: 
/* If this is a class object, mark various other things that 


* its internals point to. 
* 


* All class objects are instances of java.lang.Class, 

* including the java.lang.Class class object. 

d 

if (clazz == gDvm.classJavaLangClass) { 
scanClassObject ((ClassObject *)obj, ctx); 

} 


} 


#if WITH OBJECT HEADERS 
gMarkParent = NULL; 
#endif 
} 
从 目前 情况 看 , Dalvik 虚拟 机 在 内 存 管 理 机 制 方面 非常 简单 , 甚至 连 object 的 reuse 都 没有 。 
因此 ， 也 没 generation 的 设计 。 目 前 也 没 进行 周期 性 的 扫描 检查 ， 一 直 用 到 内 存 不 够 时 才 开 始 
扫描 。 由 此 可 见 ，Dalvik 虚拟 机 在 未 来 还 有 不 少 的 改进 空间 ， 能 够 给 我 们 提供 更 高 的 处 理 效率 。 


8.7 优化 Dalvik 虚拟 机 的 堆 内 存 分 配 


对 于 Android 平台 来 说 ， 其 托管 层 使 用 的 是 Dalvik Java 虚拟 机 。 从 目前 的 表现 来 看 ， 还 有 
很 多 地 方 可 以 进行 优化 处 理 ， 比 如 我 们 在 开发 一 些 大 型 游戏 或 耗资 源 的 应 用 中 可 能 考虑 手动 干 
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涉 GC 处 理 ， 使 用 类 dalvik.system. VMRuntime 提供 的 方法 setTargetHeapUtilization0 可 以 增强 程 
序 堆 内 存 的 处 理 效率 。 下 面 是 具体 的 使 用 方法 。 


private final static float TARGET HEAP UTILIZATION = 0.75f; 
在 程序 onCreate 时 就 可 以 调用 如 下 方法 即 可 。 
VMRuntime.getRuntime().setTargetHeapUtilization(TARGET HEAP UTILIZATION) ; 


对 于 一 些 大 型 Android 项 目 或 游戏 来 说 ， 若 在 算法 处 理 上 没有 问题 ， 影 响 性 能 瓶颈 的 主要 
是 Android 自己 内 存 管理 机 制 问题 。 目 前 手机 厂商 对 内 存 都 比较 音 沸 ， 对 于 软件 的 流畅 性 来 说 
内 存 对 性 能 的 影响 十 分 敏感 ， 除 了 优化 Dalvik 虚拟 机 的 堆 内 存 分 配 外 ， 我 们 还 可 以 强制 定义 软 
件 对 内 存 大 小 的 要 求 。 

可 以 使 用 Dalvik 虚拟 机 提供 的 类 dalvik.system.VMRuntime 来 设置 最 小 堆 内 存 。 类 
VMRuntime 提供 了 对 虚拟 机 全 局 的 特定 功能 的 接口 ，Android 为 每 个 程序 分 配 的 对 内 存 可 以 通 
过 类 Runtime 的 方法 totalMemory0 和 方法 freeMemory0 获 取 VM 的 一 些 内 存 信 息 。 

private final static int CWJ HEAP SIZE = 6* 1024* 1024 ; 

VMRuntime.getRuntime().setMinimumHeapSize(CWJ HEAP SIZE); // 设 置 最 小 heap 内 存 为 6MB 大 小 

当然 对 于 内 存 吃紧 的 机 器 来 说 ， 还 可 以 通过 手动 干涉 GC 的 方式 去 处 理 。 比 如 在 处 理 图 片 
时 ， 通 常 需要 销毁 Android 上 的 Bitmap 对 象 ， 我 们 可 以 借助 方法 recycle0 显 式 让 GC 回收 一 个 
Bitmap 对 象 ， 通 常 对 一 个 不 用 的 Bitmap 可 以 使 用 下 面 的 方式 。 

if (bitmapObject.isRecycled()==false) // 如 果 没有 回收 

bitmapObject.recycle(); 

其 中 用 Max Heap Size 表示 堆 内 存 的 上 限 值 ,Android 的 缺 省 值 是 16MB( 某 些 机 型 是 24MB), 
对 于 普通 应 用 这 是 不 能 改 的 。 函 数 setMinimumHeapSize 其 实 只 是 改变 了 堆 的 下 限 值 ， 它 可 以 防 
止 过 于 频繁 的 堆 内 存 分 配 ， 当 设置 最 小 堆 内 存 大 小 超过 上 限 值 时 仍然 采用 堆 的 上 限 值 (16MB)， 
对 于 内 存 不 足 没什么 作用 。 

方法 setTargetHeapUtilization(float newTargeb 可 以 设 定 内 存 利用 率 的 百分比 ， 当 实际 的 利用 
率 偏离 这 个 百分比 的 时 候 , 虚拟 机 会 在 GC 时 调整 堆 内 存 的 大 小 , 让 实际 占用 率 向 个 百分比 靠拢 。 


8.8 查看 Android 内 存 泄漏 的 工具 一 一 MAT 


MAT 是 Memory Analyzer Tool 的 缩写 , 是 一 个 Eclipse 插件 , 同时 也 有 单独 的 RCP 客户 端 。 
编者 使 用 的 是 MAT 的 Eclipse 插件 ， 使 用 插件 要 比 RCP 稍微 方便 一 些 。 下 载 后 的 目录 结构 如 
图 8-12 所 示 。 
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图 8-13 打开 MAT 后 的 界面 


这 样 通过 图 8-13 中 的 File 菜单 可 以 打开 用 DDMS 生成 的 .hprof 文件 ， 例 如 打开 一 个 .hprof 
文件 后 的 界面 如 图 8-14 所 示 。 
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图 8-14 分 析 界 面 


从 图 8-14 中 可 以 看 到 MAT 的 大 部 分 功能 ， 具 体 说 明 如 下 。 
(1) Histogram: 可 以 列 出 内 存 中 的 对 象 ， 对 象 的 个 数 以 及 大 小 。 
Q) Dominator Tree 可 以 列 出 那个 线程 ， 以 及 线程 下 面 的 那些 对 象 占用 的 空间 。 
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(3) Top consumers 通过 图 形 列 出 最 大 的 object。 
(4) Leak Suspects 通过 MA 自动 分 析 泄漏 的 原因 。 
单 击 Histogram 选项 后 的 界面 如 图 8-15 所 示 。 
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8-15 Histogram 界面 


图 8-15 中 主要 选项 的 说 明 如 下 。 
Q Objects: 类 的 对 象 的 数量 。 
O Shallow heap: 就 是 对 象 本 身 占用 内 存 的 大 小 ， 不 包含 对 其 他 对 象 的 引用 ， 也 就 是 对 象 


头 加 成 员 变 量 (不 是 成 员 变 量 的 值 ) 的 总 和 。 


Q Retained heap: 是 该 对 象 自己 的 shallow size， 加 上 从 该 对 象 能 直接 或 间接 访问 到 对 象 


的 shallow size 之 和 。 换 句 话说 ，retained size 是 该 对 象 被 GC 之 后 所 能 回收 到 内 存 的 
总 和 。 


单 击 Dominator Tree 选项 后 的 界面 如 图 8-16 所 示 。 
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8-16 Dominator Tree 界面 
fili Overview 选项 后 的 界面 如 图 8-17 所 示 。 
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8-17 Overview 界面 
单 击 图 8-17 下 方 的 Leak Suspects 链接 后 ， 可 以 查看 详细 的 内 存 报表 ， 如 图 8-18 所 示 。 
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8-18 Leak Suspects 查看 详细 的 内 存 报表 
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第 9 章 垃圾 收集 


在 任何 虚拟 机 应 用 中 ， 都 在 追求 处 理 效率 。 在 追求 效率 时 ， 垃 圾 收集 是 提高 效率 的 重要 手 
段 之 一 。 在 Dalvik 虚拟 机 中 ， 使 用 了 和 传统 Java 虚拟 机 类 似 的 垃圾 收集 机 制 。 本 章 将 详细 讲解 
Java 虚拟 机 和 Dalvik 虚拟 机 中 垃圾 收集 的 基本 知识 , 为 读者 步 入 本 书后 面 知识 的 学 习 打 下 基础 。 


9.1 初探 Java 虚拟 机 中 的 垃圾 收集 


本 节 将 详细 讲解 Java 虚拟 机 垃圾 收集 的 基本 知识 ， 为 读者 步 入 本 书后 面 知识 的 学 习 打下 坚 
实 的 基础 。 


9.1.1 何谓 垃圾 收集 


垃圾 收集 (Garbage Collection，GC) 提 供 了 内 存 管理 的 机 制 ， 使 得 应 用 程序 不 需要 关注 内 存 
是 如 何 释 放 的 ， 内 存 用 完 后 ， 垃 圾 收集 会 进行 收集 ， 这 样 就 减轻 了 因 人 为 管理 内 存 而 造成 的 错 
误 ， 比 如 在 C++ 语 言 里 ， 出 现 内 存 泄漏 是 很 常见 的 。 

Java 是 目前 使 用 最 多 的 依赖 于 垃圾 收集 器 的 语言 ， 但 是 垃圾 收集 器 策略 从 20 世纪 60 年 代 
就 已 经 流行 起 来 了 ， 比 如 Smalltalk 和 Eiffel 等 编程 语言 都 集成 了 垃圾 收集 器 的 机 制 。 

在 堆 里 面 存放 着 Java 世界 中 几乎 所 有 的 对 象 ， 在 垃圾 回收 前 首先 要 确定 这 些 对 象 之 中 哪些 
还 在 存活 ， 哪 些 已 经 “ 死 ” 了 ， 即 不 可 能 再 被 任何 途径 使 用 的 对 象 。 


9.1.2 ”常见 的 垃圾 收集 策略 
所 有 的 垃 ie: 


LÀ 深入 理解 Android 虚拟 机 -i 


go ee s 


1. Reference Counting( 引 用 计数 ) 


引用 计数 是 最 简单 直接 的 一 种 方式 ， 这 种 方式 在 每 一 个 对 象 中 增加 一 个 引用 的 计数 ， 这 个 
计数 代表 当前 程序 有 多 少 个 引用 引用 了 此 对 象 , 如 果 此 对 象 的 引用 计数 变 为 0, 那么 此 对 象 就 可 
以 作为 垃圾 收集 器 的 目标 对 象 来 收集 。 

这 种 策略 的 优点 是 简单 、 直 接 ， 不 需要 暂停 整个 应 用 。 其 缺点 是 需要 编译 器 的 配合 ， 编 译 
器 要 生成 特殊 的 指令 来 进行 引用 计数 的 操作 ， 比 如 每 次 将 对 象 赋值 给 新 的 引用 ， 或 者 对 象 的 引 
用 超出 了 作用 域 等 ， 并 且 不 能 处 理 循环 引用 的 问题 。 


2. 跟踪 收集 器 


跟踪 收集 器 首先 要 暂停 整个 应 用 程序 ， 然 后 开始 从 根 对 象 扫描 整个 堆 ， 判 断 扫描 的 对 象 是 
否 有 对 象 引 用 ， 在 此 需要 搞 清楚 下 面 的 三 个 问题 。 

(1) 如 果 每 次 扫描 整个 堆 ， 那 么 势必 让 垃圾 收集 的 时 间 变 长 ， 从 而 影响 了 应 用 本 身 的 执行 。 
因此 在 Java 虚拟 机 里 面 采 用 了 分 代 收 集 ， 在 新 生 代 收 集 的 时 候 minor gc 只 需要 扫描 新 生 代 ， 而 
不 需要 扫描 老生 代 。 

(2) Java 虚拟 机 采用 了 分 代 收 集 以 后 ，minor ge 只 扫描 新 生 代 ， 但 是 minor ge 怎么 判断 是 
否 有 老生 代 的 对 象 引 用 了 新 生 代 的 对 象 ，Java 虚拟 机 采用 了 卡片 标记 的 策略 ， 卡 片 标记 将 老生 
代 分 成 了 一 块 一 块 的 ， 划 分 以 后 的 每 一 个 块 就 叫 作 一 个 卡片 ，Java 虚拟 机 采用 卡 表 维护 了 每 一 
个 块 的 状态 ， 当 Java 程序 运行 时 ， 如 果 发 现 老生 代 对 象 引 用 或 者 释放 了 新 生 代 对 象 的 引用 ， 那 
么 Java 虚拟 机 就 将 卡 表 的 状态 设置 为 脏 状态 ， 这 样 每 次 minor ge 时 就 会 只 扫描 被 标记 为 脏 状态 
的 卡片 ， 而 不 需要 扫描 整个 堆 。 

(3) 垃圾 收集 在 收集 一 个 对 象 时 会 判断 是 否 有 引用 指向 对 象 , 在 Java 中 的 引用 主要 有 4 种 ， 
分 别 是 Strong reference, Soft reference, Weak reference 和 Phantom reference. 

@ 强 引用 (Strong Reference). 

强 引用 是 Java 中 默认 采用 的 一 种 方式 ， 我 们 平时 创建 的 引用 都 属于 强 引用 。 如 果 一 个 对 象 
没有 强 引 用 ， 那 么 对 象 就 会 被 回收 。 例 如 下 面 的 代码 。 

public void testStrongReference () { 

Object referent = new Object(); 

Object strongReference = referent; 

referent = null; 


System.gc() ; 
assertNotNull (strongReference) ; 


Q) 软 引用 (Soft Reference). 
软 引 用 的 对 象 在 垃圾 收集 时 不 会 被 回收 ， 只 有 当 内 存 不 够 用 时 才 会 真正 地 回收 ， 因 此 软 引 
用 适合 缓存 的 场合 ， 这 样 使 得 缓存 中 的 对 象 可 以 尽量 地 在 内 存 中 待 长 久 一 点 。 例 如 下 面 的 代码 。 


Public void testSoftReference () { 

String str = "test"; 

SoftReference<String> softreference = new SoftReference<String>(str) ; 
str=null; 

System.gc() ; 

assertNotNull (softreference.get ()); 


} 


> 
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© 弱 引 用 (Weak reference). 
弱 引 用 有 利于 对 象 更 快 的 被 回收 ， 假 如 一 个 对 象 没 有 强 引 用 只 有 弱 引 用 ， 那 么 在 垃圾 收集 
后 ， 这 个 对 象 肯定 会 被 回收 。 例 如 下 面 的 代码 。 

Public void testWeakReference(){ 

String str = "test"; 

WeakReference<String> weakReference = new WeakReference<String>(str) ; 

str=null; 

System.gc() ; 

assertNull (weakReference.get ()) ; 

} 

@ Phantom reference. 

OQ  Mark-Sweep Collector( 标 记 - 清 除 收 集 器 ) 
标记 清除 收集 器 最 早 由 Lisp 的 发 明 人 于 1960 年 提出 ， 标 记 清除 收集 器 停止 所 有 的 工 
作 ， 从 根 扫描 每 个 活跃 的 对 象 ， 然 后 标记 扫描 过 的 对 象 ， 标 记 完 成 后 ， 清 除 那些 没有 
被 标记 的 对 象 。 
其 优点 是 解决 循环 引用 的 问题 , 并 且 不 需要 编译 器 的 配合 ， 从 而 就 不 执行 额外 的 指令 。 
其 缺点 是 每 个 活跃 的 对 象 都 要 进行 扫描 ， 收 集 暂停 的 时 间 比 较 长 。 

Q Copying Collector( 复 制 收集 器 ) 
复制 收集 器 将 内 存 分 为 两 块 一 样 大 小 空间 ， 某 一 个 时 刻 ， 只 有 一 个 空间 处 于 活跃 的 状 
态 ， 当 活跃 的 空间 满 时 ， 垃 圾 收集 就 会 将 活跃 的 对 象 复制 到 未 使 用 的 空间 中 去 ， 原 来 
不 活跃 的 空间 就 变 为 了 活跃 的 空间 。 
复制 收集 器 的 优点 是 只 扫描 可 以 到 达 的 对 象 ， 不 需要 扫描 所 有 的 对 象 ， 从 而 减少 了 应 
用 暂停 的 时 间 。 其 缺点 是 需要 额外 的 空间 消耗 ， 某 一 个 时 刻 ， 总 是 有 一 块 内 存 处 于 未 
使 用 状态 。 复 制 对 象 需要 一 定 的 开销 。 

口 “Mark-Compact Collector( 标 记 - 整 理 收集 器 ) 
标记 整理 收集 器 汲取 了 标记 清除 和 复制 收集 器 的 优点 ， 它 分 两 个 阶段 执行 ， 在 第 一 个 
阶段 ， 首 先 扫描 所 有 活跃 的 对 象 ， 并 标记 所 有 活跃 的 对 象 ， 第 二 个 阶段 首先 清除 未 标 
记 的 对 象 ， 然 后 将 活跃 的 对 象 复制 到 堆 的 底部 。Mark-compact 策略 极 大 地 减少 了 内 存 
碎片 ， 并 且 不 需要 像 Copy Collector 一 样 需要 2 倍 的 空间 。 


9.1.3 Java 虚拟 机 的 垃圾 收集 策略 


垃圾 收集 执行 时 要 耗费 一 定 的 CPU 资源 和 时 间 ， 因 此 在 JDK1.2 以 后 ，Java 虚拟 机 引入 了 
分 代 收 集 的 策略 ， 其 中 对 新 生 代 采用 “Mark-Compact” 策 略 ， 而 对 老生 代 采 用 了 “Mark-Sweep” 
的 策略 。 其 中 新 生 代 的 垃圾 收集 器 命名 为 “minor gc”， 老 生 代 的 垃圾 收集 命名 为 “Full Ge” Be 
“Major GC”。 其 中 用 System.gc0 强 制 执 行 的 是 完全 垃圾 收集 。 


1. Serial Collector 


Serial Collector 是 指 任 何 时 刻 都 只 有 一 个 线程 进行 垃圾 收集 , 这 种 策略 有 一 个 名 字 “stop the 
whole world”， 它 需要 停止 整个 应 用 的 执行 。 这 种 类 型 的 收集 器 适合 于 单 CPU 的 机 器 。 


Serial Copying Collector 


<D 
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此 种 垃圾 收集 用 -XX:UseSerialGC 选项 配置 ， 只 用 于 新 生 代 对 象 的 收集 。1.5.0 以 后 
-XX:MaxTenuringThreshold 来 设置 对 象 复制 的 次 数 。 当 eden 空间 不 够 时 , 垃圾 收集 会 将 eden 的 
活跃 对 象 和 一 个 名 叫 From survivor 空间 中 尚 不 够 资格 放 入 老生 代 的 对 象 复制 到 另外 一 个 名 字 叫 
To Survivor 的 空间 。 而 此 参数 就 是 用 来 说 明 到 底 From survivor 中 的 哪些 对 象 不 够 资格 ， 假 如 这 
个 参数 设置 为 31， 那 么 也 就 是 说 只 有 对 象 复制 31 次 以 后 才 算是 有 资格 的 对 象 。 

From Survivor 和 To survivor 的 角色 是 不 断 地 变化 的 ,同一 时 间 只 有 一 块 空间 处 于 使 用 状态 ， 
这 个 空间 就 叫 作 From Survivor 区 ， 当 复制 一 次 后 角色 就 发 生 了 变化 。 

如 果 复 制 的 过 程 中 发 现 To survivor 空间 已 经 满 了 ， 那 么 就 直接 复制 到 老生 代 。 

比较 大 的 对 象 也 会 直接 复制 到 老生 代 ， 在 开发 中 ， 我 们 应 该 尽量 避免 这 种 情况 的 发 生 。 


Serial Mark-Compact Collector 


串 行 的 标记 -整理 收集 器 是 TDKS 在 升级 到 6 之 前 默认 的 老生 代 的 垃圾 收集 器 ， 此 收集 使 得 
内 存 碎片 最 少 化 ， 但 是 它 需 要 暂停 的 时 间 比 较 长 

2. Parallel Collector 

Parallel Collector 主要 是 为 了 应 对 多 CPU, 大 数据 量 的 环境 。Parallel Collector 又 可 以 分 为 以 
下 两 种 : 

(1) Parallel Copying Collector: 此 种 垃圾 收集 用 -XX:UseParNewGC 参数 配置 ， 它 主要 用 于 
新 生 代 的 收集 ， 此 垃圾 收集 可 以 配合 CMS 一 起 使 用 。 

(2) 在 1.4.1 版 本 以 后 用 以 下 代码 。 

Parallel Mark-Compact Collector 


此 种 垃圾 收集 用 -XX:UseParalleloldGC 参数 配置 ， 此 垃圾 收集 主要 用 于 老生 代 对 象 的 收集 
1.6.0 后 用 以 下 代码 。 


Parallel scavenging Collector 

此 种 垃圾 收集 用 -XX:UseParallelGC 参数 配置 ， 它 是 对 新 生 代 对 象 的 垃圾 收集 器 ， 但 是 它 不 
能 和 CMS 配合 使 用 ， 它 适合 于 比较 大 新 生 代 的 情况 ， 此 收集 器 起 始 于 JDK 1.4.0。 它 比较 适合 
于 对 吞吐 量 高 于 暂停 时 间 的 场合 。 

3. Concurrent Collector 

Concurrent Collector 通过 并 行 的 方式 进行 垃圾 收集 , 这 样 就 减少 了 垃圾 收集 器 收集 一 次 的 时 
间 ， 这 种 垃圾 收集 在 实时 性 要 求 高 于 吞吐 量 的 时 候 比 较 有 用 。 此 种 垃圾 收集 可 以 用 参数 
-XX:UseConcMarkSweepGC 配置 ， 此 垃圾 收集 主要 用 于 老生 代 和 持久 代 的 收集 。 


9.2 Java 虚拟 机 垃圾 收集 的 算法 


由 于 垃圾 收集 算法 的 实现 涉及 大 量 的 程序 细节 ， 而 且 各 个 平台 的 虚拟 机 操作 内 存 的 方法 又 
各 不 相同 ， 因 此 本 节 不 打算 过 多 地 讨论 算法 的 实现 ， 只 是 介绍 几 种 算法 的 思想 及 其 发 展 过 程 。 
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9.2.1 “标记 -清除 ”算法 


“标记 -清除 ”(Mark-Sweep) 算 法 是 最 基础 的 收集 算法 。 在 标记 阶段 ， 确 定 所 有 要 回收 的 对 
象 ， 并 做 标记 。 正 如 它 的 名 字 一 样 ， 该 算法 分 为 “标记 ”和 “清除 ”两 个 阶段 ， 具 体 过 程 如 下 。 
钙 标记 出 所 有 需要 回收 的 对 象 。@ 在 标记 完成 后 统一 回收 掉 所 有 被 标记 的 对 象 。 清 除 阶段 紧 随 
标记 阶段 ， 将 标记 阶段 确定 不 可 用 的 对 象 清除 。 之 所 以 说 它 是 最 基础 的 收集 算法 ， 是 因为 后 续 
的 收集 算法 都 是 基于 这 种 思路 并 对 其 缺点 进行 改进 而 得 到 的 。 它 的 主要 有 两 个 缺点 如 下 : Ose 
效率 问题 ， 标 记 和 清除 过 程 的 效率 都 不 高 ，@ 是 空间 问题 ， 标 记 清除 后 会 产生 大 量 不 连续 的 内 
存 碎 片 ， 空 间 碎片 太 多 可 能 会 导致 ， 当 程序 在 以 后 的 运行 过 程 中 需要 分 配 较 大 对 象 时 无 法 找到 
足够 的 连续 内 存 而 不 得 不 提前 触发 男 一 次 垃圾 收集 动作 。 

标记 -清除 算法 包括 两 个 阶段 : “标记 ”和 “清除 ”。 标 记 -清除 算法 是 基础 的 收集 算法 ， 
标记 和 清除 阶段 的 效率 不 高 ， 而 且 清除 后 会 产生 大 量 的 不 连续 空间 ， 这 样 当 程序 需要 分 配 大 内 
存 对 象 时 ， 可 能 无 法 找到 足够 的 连续 空间 。 

垃圾 回收 前 的 状况 如 下 。 


垃圾 回收 后 的 状况 如 下 。 


图 中 绿色 表示 存活 对 象 ， 红 色 表 示 可 回收 对 象 ， 白色 表示 未 使 用 空间 。 


9.22 ”复制 算法 


为 了 解决 效率 问题 ， 可 以 使 用 “复制 ”(Copying) 的 收集 算法 可 用 内 存 按 容量 划分 为 大 小 相 
等 的 两 块 ， 每 次 只 使 用 其 中 的 一 块 。 当 这 一 块 的 内 存 用 完了 ， 就 将 还 存活 着 的 对 象 复 制 到 另外 
- 块 内 存 上 ， 然 后 再 把 已 使 用 过 的 内 存 空间 一 次 清理 掉 。 这 样 使 得 每 次 都 是 对 其 中 的 一 块 进行 
内 存 回收 ， 内 存 分 配 时 也 就 不 用 考虑 内 存 碎片 等 复杂 情况 ， 只 要 移动 堆 顶 指针 ， 按 顺序 分 配 内 
存 即 可 ， 实 现 简单 ， 运 行 高 效 。 只 是 这 种 算法 的 代价 是 将 内 存 缩小 为 原来 的 一 半 ， 成 本 未 免 太 
高 了 一 点 。 

复制 算法 实现 简单 ， 运 行 效率 高 ， 但 是 由 于 每 次 只 能 使 用 其 中 的 一 半 ， 造 成 内 存 的 利用 率 
不 高 。 现在 的 Java 虚拟 机 用 复制 方法 收集 新 生 代 , 由 于 新 生 代 中 大 部 分 对 象 (98%) 都 是 朝 生 夕 死 
的 ， 所 以 两 块 内 存 的 比例 不 是 1 : 1， 大 概 是 8 : 1。 

垃圾 回收 前 的 状况 如 下 。 
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图 中 绿色 表示 存活 对 象 ， 红色 表示 可 回收 对 象 ， 白色 表 示 未 使 用 空间 。 

现在 的 商业 虚拟 机 都 采用 这 种 收集 算法 来 回收 新 生 代 ，IBM 公司 的 专门 研究 表明 ， 新 生 代 
中 的 对 象 98% 是 朝 生 夕 死 的 ， 所 以 并 不 需要 按照 1 : 1 的 比例 来 划分 内 存 空 间 ， 而 是 将 内 存 分 为 

- 块 较 大 的 Eden 空间 和 两 块 较 小 的 Survivor 空间 ， 每 次 使 用 Eden 和 其 中 的 一 块 Survivors = 
回收 时 ， 将 Eden 和 Survivor 中 还 存活 着 的 对 象 一 次 性 地 复制 到 另外 一 块 Survivor 空间 上 ， 最 后 
清理 掉 Eden 和 刚才 用 过 的 Survivor 的 空间 。 HotSpot 虚拟 机 默认 Eden 和 Survivor 的 大 小 比例 是 
8 : 1， 也 就 是 每 次 新 生 代 中 可 用 内 存 空 间 为 整个 新 生 代 容 量 的 90%(80%+10%)， 只 有 10% 的 内 
存 是 会 被 “浪费 ”的 。 当 然 ，98% 的 对 象 可 回收 只 是 一 般 场景 下 的 数据 ， 我 们 没有 办 法 保证 每 
次 回收 都 只 有 不 多 于 10% 的 对 象 存活 ， 当 Survivor 空间 不 够 用 时 ， 需 要 依赖 其 他 内 存 ( 这 里 指 老 
生 代 ) 进 行 分 配 担保 (Handle Promotion)。 

内 存 的 分 配 担保 就 好 比 我 们 去 银行 借款 ， 如 果 我 们 的 信誉 很 好 ， 在 98% 的 情况 下 都 能 按时 
偿还 ， 于 是 银行 可 能 会 默认 我 们 下 一 次 也 能 按时 按 量 地 偿还 贷款 ， 只 需要 有 一 个 担保 人 能 保证 
如 果 我 不 能 还 款 时 ， 可 以 从 他 的 账户 扣 钱 ， 那 银行 就 认为 没有 风险 了 。 内 存 的 分 配 担保 也 一 样 ， 
如 果 另 外 一 块 Survivor 空间 没有 足够 的 空间 存放 上 一 次 新 生 代 收 集 下 来 的 存活 对 象 ， 这 些 对 象 
将 直接 通过 分 配 担 保 机 制 进入 老生 代 。 关 于 对 新 生 代 进行 分 配 担保 的 内 容 ， 本 章 稍 后 在 讲解 垃 
圾 收集 器 执行 规则 时 还 会 对 此 进行 详细 讲解 。 


9.23 ”标记 -整理 算法 


复制 收集 算法 在 对 象 存活 率 较 高 时 就 要 执行 较 多 的 复制 操作 ， 效 率 将 会 变 低 。 更 关键 的 是 ， 
如 果 不 想 浪 费 50% 的 空间 ， 就 需要 有 额外 的 空间 进行 分 配 担保 ， 以 应 对 被 使 用 的 内 存 中 所 有 对 
象 都 100% 存 活 的 极端 情况 ， 所 以 在 老生 代 一 般 不 能 直接 选用 这 种 算法 。 

根据 老年 代 的 特点 ， 有 人 提出 了 另外 一 种 “标记 -整理 ”(Mark-Compact) 算 法 ， 标 记过 程 仍 
然 与 “标记 -清除 ”算法 一 样 ， 但 后 续 步骤 不 是 直接 对 可 回收 对 象 进行 清理 ， 而 是 让 所 有 存活 的 
对 象 都 向 一 端 移动 ， 然 后 直接 清理 掉 端 边界 以 外 的 内 存 。 

标记 -整理 算法 和 标记 -清除 算法 一 样 , 但 是 标记 -整理 算法 不 是 把 存活 对 象 复制 到 另 一 块 内 
存 ， 而 是 把 存活 对 象 往 内 存 的 一 端 移动 ， 然 后 直接 回收 边界 以 外 的 内 存 。 

标记 -整理 算法 提高 了 内 存 的 利用 率 ， 并 且 它 适合 在 收集 对 象 存活 时 间 较 长 的 老生 代 。 
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垃圾 回收 前 的 状况 如 下 。 


垃圾 回收 后 的 状况 如 下 。 
| | | | | | | | | 
| | | 


图 中 绿色 表示 存活 对 象 ， 红 色 表 示 可 回收 对 象 ， 白 色 表示 未 使 用 空间 。 


9.24 ”分 代 收 集 算法 


当前 商业 虚拟 机 的 垃圾 收集 都 采用 “分 代 收 集 ”(Generational Collection) 算 法 ， 这 种 算法 并 
没有 什么 新 的 思想 ， 只 是 根据 对 象 的 存活 周期 的 不 同 将 内 存 划分 为 几 块 。 一 般 是 把 Java 堆 分 为 
新 生 代 和 老生 代 ， 这 样 就 可 以 根据 各 个 年 代 的 特点 采用 最 适当 的 收集 算法 。 在 新 生 代 中 ， 每 次 
垃圾 收集 时 都 发 现 有 大 批 对 象 死去 ， 只 有 少量 存活 ， 那 就 选用 复制 算法 ， 只 需要 付出 少量 存活 
对 象 的 复制 成 本 就 可 以 完成 收集 。 而 老生 代 中 因为 对 象 存活 率 高、 没有 额外 空间 对 它 进 行 分 配 
担保 ， 就 必须 使 用 “标记 -清理 ”或 “标记 -整理 ”算法 来 进行 回收 。 

分 代 收 集 是 根据 对 象 的 存活 时 间 把 内 存 分 为 新 生 代 和 老生 代 ， 根 据 个 代 对 象 的 存活 特点 ， 
每 个 代 采 用 不 同 的 垃圾 回收 算法 。 新 生 代 采 用 标记 -复制 算法 ， 老 生 代 采 用 标记 -整理 算法 。 


9.3 垃圾 收集 器 


如 果 说 收集 算法 是 内 存 回收 的 方法 论 ， 垃 圾 收集 器 就 是 内 存 回收 的 具体 实现 。Java 虚拟 机 
规范 中 对 垃圾 收集 器 应 该 如 何 实现 并 没有 任何 规定 ， 因 此 不 同 的 厂商 、 不 同 版 本 的 虚拟 机 所 提 
供 的 垃圾 收集 器 都 可 能 会 有 很 大 的 差别 ， 并 且 一 般 都 会 提供 参数 供用 户 根据 自己 的 应 用 特点 和 
要 求 组 合 出 各 个 年 代 所 使 用 的 收集 器 。 这 里 讨论 的 收集 器 基于 Sun HotSpot 虚拟 机 1.6 版 至 22 
版 ， 这 个 虚拟 机 包含 的 所 有 收集 器 如 图 9-1 所 示 。 

图 9-1 展示 了 7 种 作用 于 不 同 分 代 的 收集 器 (包括 IDK 1.6 升级 到 14 后 引入 的 Early Access 
版 G1 收集 器 )， 如 果 两 个 收集 器 之 间 存 在 连 线 ， 就 说 明 它 们 可 以 搭配 使 用 。 

在 介绍 这 些 收集 器 各 自 的 特性 之 前 ， 我 们 先 要 明确 一 个 观点 : 虽然 我 们 是 在 对 各 个 收集 器 
进行 比较 ， 但 并 非 为 了 挑选 一 个 最 好 的 收集 器 出 来 。 因 为 直到 现在 为 止 还 没有 最 好 的 收集 器 出 
现 ， 更 加 没有 万 能 的 收集 器 ， 所 以 我 们 选择 的 只 是 对 具体 应 用 最 合适 的 收集 器 。 这 点 不 需要 多 
加 解释 就 能 证 明 : 如 果 有 一 种 放 之 四 海 皆 准 、 在 任何 场景 下 都 适用 的 完美 收集 器 存在 , AB HotSpot 
虚拟 机 就 没 必要 实现 那么 多 不 同 的 收集 器 了 。 
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9-1 HotSpot Java 虚拟 机 1.6 的 垃圾 收集 器 


9.3.1 Serial 收集 器 


Serial 收集 器 是 最 基本 、 历 史 最 悠久 的 收集 器 ， 曾 经 (在 IDK 1.3.1 之 前 ) 是 虚拟 机 新 生 代 收 
集 的 唯一 选择 。 大 家 看 名 字 就 知道 ， 这 个 收集 器 是 一 个 单线 程 的 收集 器 ， 但 其 “单线 程 ” 的 意 
义 并 不 仅仅 是 说 明 它 只 会 使 用 一 个 CPU 或 一 条 收集 线程 去 完成 垃圾 收集 工作 ， 更 重要 的 是 在 它 
进行 垃圾 收集 时 ， 必 须 暂 停 其 他 所 有 的 工作 线程 (Sun 公司 将 这 件 事情 称 为 “Stop The World” ), 
直到 它 收集 结束 。“Stop The World” 这 个 名 字 也 许 听 起 来 很 酷 ， 但 这 项 工作 实际 上 是 由 虚拟 机 
在 后 台 自 动 发 起 和 自动 完成 的 ， 在 用 户 不 可 见 的 情况 下 把 用 户 的 正常 工作 的 线程 全 部 停 掉 ， 这 
对 很 多 应 用 来 说 都 是 难以 接受 的 。 你 想 想 , 要 是 你 的 电脑 每 运行 1h 就 会 暂停 响应 Smin， 你 会 有 
什么 样 的 心情 呢 。 

对 于 “Stop The World” 带 给 用 户 的 恶劣 体验 ， 虚 拟 机 的 设计 者 们 表示 完全 理解 ， 但 也 表示 
非常 委 届 : “你 妈妈 在 给 你 打扫 房间 时 ， 肯 定 也 会 让 你 老 老实 实地 在 椅子 上 或 房间 外 待 着 ， 如 
果 她 一 边 打 扫 ， 你 一 边 乱 扔 纸 届 ， 这 房间 还 能 打扫 完 吗 ? ”这 确实 是 一 个 合情合理 的 矛盾 ， 虽 
然 垃圾 收集 这 项 工作 听 起 来 和 打扫 房间 属于 一 个 性 质 的 , 但 实际 上 肯定 还 要 比 打扫 房间 复杂 
得 多 。 

从 IDK 1.3 开始 ， 一 直到 现在 还 没 正 式 发 布 的 JDK 1.7, HotSpot 虚拟 机 开发 团队 为 消除 或 
减少 工作 线程 因 内 存 回 收 而 导致 停顿 的 努力 一 直 在 进行 着 ， 从 Serial 收集 器 到 Parallel 收集 器 ， 
再 到 Concurrent Mark Sweep(CMS) 现 在 还 未 正式 发 布 的 Garbage First(G1) 收 集 器 , 我 们 看 到 了 一 
个 个 越 来 越 优秀 (也 越 来 越 复杂 ) 的 收集 器 的 出 现 , 用 户 线程 的 停顿 时 间 在 不 断 缩短 , 但 是 仍然 没 
有 办 法 完全 消除 (这 里 暂 不 包括 RTSI 中 的 收集 器 )。 寻 找 更 优秀 的 垃圾 收集 器 的 工作 仍 在 继续 ! 

也 许 很 多 人 把 Serial 收集 器 描述 成 一 个 老 而 无 用 ， 食 之 无 味 弃 之 可 惜 的 鸡肋 ， 但 实际 上 到 
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现在 为 止 ， 它 依然 是 虚拟 机 运行 在 Client 模式 下 的 默认 新 生 代 收集 器 。 它 也 有 着 优 于 其 他 收集 
器 的 地 方 : 简单 而 高 效 (与 其 他 收集 器 的 单线 程 比 )， 对 于 限定 单个 CPU 的 环境 来 说 ，Serial 收集 
器 由 于 没有 线程 交互 的 开销 ， 专 心 做 垃圾 收集 自然 可 以 获得 最 高 的 单线 程 收集 效率 。 在 用 户 的 
桌面 应 用 场景 中 ， 分 配给 虚拟 机 管理 的 内 存 一 般 来 说 不 会 很 大 ， 收 集 几 十 兆 甚至 一 两 百 兆 字 节 
的 新 生 代 ( 仅 仅 是 新 生 代 使 用 的 内 存 ， 桌 面 应 用 基本 上 不 会 再 大 了 ),， 停顿 时 间 完 全 可 以 控制 在 几 
十 毫秒 最 多 一 百 多 毫秒 内 ， 只 要 不 是 频繁 地 发 生 ， 这 点 停顿 是 可 以 接受 的 。 所 以 ，Serial 收集 器 
对 于 运行 在 Client 模式 下 的 虚拟 机 来 说 是 一 个 很 好 的 选择 。 


9.3.2 ParNew 收集 器 


ParNew 收集 器 其 实 就 是 Serial 收集 器 的 多 线程 版 本 ,除了 使 用 多 条 线程 进行 垃圾 收集 之 外 ， 
其 余 行 为 包括 Serial 收集 器 可 用 的 所 有 控制 参数 (例如 :-XX:SurvivorRatio、-XX:PretenureSizeThreshold、 
-XX:HandlePromotionFailure 等 )、 收 集 算法 、Stop The World、 对 象 分 配 规则 、 回 收 策略 等 都 与 
Serial 收集 器 完全 一 样 ， 实 现 上 这 两 种 收集 器 也 共用 了 相当 多 的 代码 。 

ParNew 收集 器 除了 多 线程 收集 之 外 ， 其 他 与 Serial 收集 器 相 比 并 没有 太 多 创新 之 处 ， 但 它 
却 是 许多 运行 在 Server 模式 下 的 虚拟 机 中 首选 的 新 生 代 收 集 器 ， 其 中 有 一 个 与 性 能 无 关 但 很 重 
要 的 原因 是 ， 除 了 Serial 收集 器 外 ， 目 前 只 有 它 能 与 CMS 收集 器 配合 工作 。 在 JDK 1.5 时 期 ， 
HotSpot 虚拟 机 开发 团队 推出 了 一 款 在 强 交 互 应 用 中 几乎 可 称 为 有 划时代 意义 的 垃圾 收集 器 一 
CMS 收集 器 ， 这 款 收集 器 是 HotSpot 虚拟 机 中 第 一 款 真 正 意义 上 的 并 发 (Concurrent) 收 集 器 ， 它 
第 一 次 实现 了 让 垃圾 收集 线程 与 用 户 线程 (基本 上 ) 同 时 工作 , 用 前 面 那 个 例子 的 话 来 说 , 就 是 做 
到 了 在 你 妈妈 打扫 房间 时 你 还 能 同时 往 地 上 扔 纸 眉 。 

不 幸 的 是 , 它 作 为 老生 代 的 收集 器 , 却 无 法 与 JDK 1.4.0 中 已 经 存在 的 新 生 代 收 集 器 Parallel 
Scavenge 配合 工作 ， 所 以 在 JDK 1.5 中 使 用 CMS 来 收集 老生 代 时 ， 新 生 代 只 能 选择 ParNew 或 
Serial 收集 器 中 的 一 个 。 ParNew 收集 器 也 是 使 用 -XX: +UseConcMarkSweepGC 选项 后 的 默认 新 
生 代 收 集 器 ， 也 可 以 使 用 -XX:+UseParNewGC 选项 来 强制 指定 它 。 

ParNew 收集 器 在 单 CPU 的 环境 中 绝对 不 会 有 比 Serial 收集 器 更 好 的 效果 , 甚至 由 于 存在 线 
程 交互 的 开销 ， 该 收集 器 在 通过 超 线程 技术 实现 的 两 个 CPU 的 环境 中 都 不 能 百分之百 地 保证 能 
超越 Serial 收集 器 。 当 然 ， 随 着 可 以 使 用 的 CPU 的 数量 的 增加 ， 它 对 于 GC 时 系统 资源 的 利用 
还 是 很 有 好 处 的 。 它 默认 开启 的 收集 线程 数 与 CPU 的 数量 相同 , 在 CPU 非常 多 (譬如 32 4, 现 
在 CPU 动 辆 就 4 核 加 超 线 程 , 服务 器 超过 32 个 逻辑 CPU 的 情况 越 来 越 多 了 ) 的 环境 下 , 可 以 使 
用 -XX:ParallelGCThreads 参数 来 限制 垃圾 收集 的 线程 数 。 


SER: 从 ParNew 收集 器 开始 , 后面 还 将 会 接触 到 几 款 并 发 和 并 行 的 收集 器 。 在 大 家 可 能 产生 疑 
惑 之 前 ， 有 必要 先 解释 两 个 名 词 : 并 发 和 并 行 。 这 两 个 名 词 都 是 并 发 编程 中 的 概念 ， 在 
谈论 垃圾 收集 器 的 上 下 文 语 境 中 ， 他 们 可 以 解释 为 : 

O 并 行 (Parallel]): 指 多 条 垃圾 收集 线程 并 行 工作 ， 但 此 时 用 户 线 程 仍 然 处 于 等 待 状态 。 
O 并 发 (Concurrent): 指 用 户 线程 与 垃圾 收集 线程 同时 执行 (但 不 一 定 是 并 行 的 ， 可 能 会 
交替 执行 )， 用 户 程序 继续 运行 ， 而 垃圾 收集 程序 运行 于 另 一 个 CPU 上 。 
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9.3.3 Parallel Scavenge 收集 器 


Parallel Scavenge 收集 器 也 是 一 个 新 生 代 收集 器 ， 它 也 是 使 用 复制 算法 的 收集 器 ， 又 是 并 行 
的 多 线程 收集 器 …… 看 上 去 和 ParNew 都 一 样 ， 那 么 它 有 什么 特别 之 处 呢 ? 

Parallel Scavenge 收集 器 的 特点 是 它 的 关注 点 与 其 他 收集 器 不 同 , CMS 等 收集 器 的 关注 点 尽 
可 能 地 缩短 垃圾 收集 时 用 户 线程 的 停顿 时 间 , 而 Parallel Scavenge 收集 器 的 目标 则 是 达到 一 个 可 
控制 的 吞吐 量 (Throughpub)。 所 谓 吞 吐 量 就 是 CPU 用 于 运行 用 户 代码 的 时 间 与 CPU 总 消耗 时 间 
的 比值 ， 即 吞吐 量 = 运行 用 户 代 码 时 间 /( 运 行 用 户 代码 时 间 + 垃圾 收集 时 间 )， 虚 拟 机 总 共 运 
47 T 100min， 其 中 垃圾 收集 花 掉 lmin， 那 吞吐 量 就 是 99%。 

停顿 时 间 越 短 就 越 适合 需要 与 用 户 交互 的 程序 ， 良 好 的 响应 速度 能 提升 用 户 的 体验 ， 而 高 
吞吐 量 则 可 以 最 高 效率 地 利用 CPU 时 间 ， 尽 快 地 完成 程序 的 运算 任务 ， 主 要 适合 在 后 台 运 算 而 
不 需要 太 多 交互 的 任务 。 

Parallel Scavenge 收集 器 提供 了 两 个 参数 用 于 精确 控制 吞吐 量 ， 分 别 是 控制 最 大 垃圾 收集 停 
顿时 间 的 -XX:MaxGCPauseMiillis 参数 及 直接 设置 吞吐 量 大 小 的 -XX:GCTimeRatio 参数 。 

MaxGCPauseMillis 参数 允许 的 值 是 一 个 大 于 0 的 毫秒 数 ， 收 集 器 将 尽力 保证 内 存 回收 花费 
的 时 间 不 超过 设 定 值 。 不 过 大 家 不 要 异想天开 地 认为 如 果 把 这 个 参数 的 值 设置 得 稍 小 一 点 就 能 
使 得 系统 的 垃圾 收集 速度 变 得 更 快 ， 垃 圾 收集 停顿 时 间 缩 短 是 以 牺牲 吞吐 量 和 新 生 代 空 间 来 换 
取 的 : 系统 把 新 生 代 调 小 一 些 ， 收 集 300MB 新 生 代 肯 定 比 收集 500MB 快 吧 ， 这 也 直接 导致 垃 
圾 收集 发 生得 更 频繁 一 些 ， 原 来 10s 收集 一 次 、 每 次 停顿 100ms， 现 在 变 成 Ss 收集 一 次 、 每 次 
停顿 70ms。 停 顿时 间 的 确 在 下 降 ， 但 吞吐 量 也 降下 来 了 。 

GCTimeRatio 参数 的 值 应 当 是 一 个 大 于 0 小 于 100 的 整数 ， 也 就 是 垃圾 收集 时 间 占 总 时 间 
的 比率 ， 相 当 于 是 吞吐 量 的 倒数 。 如 果 把 此 参数 设置 为 19， 那 允许 的 最 大 垃圾 收集 时 间 就 占 总 
时 间 的 5%( 即 1 (1+19))， 默 认 值 为 99， 就 是 允许 最 大 1%( 即 1 /1+99)) 的 垃圾 收集 时 间 。 

由 于 与 吞吐 量 关 系 密切 ，Parallel Scavenge 收集 器 也 经 常 被 称 为 “吞吐 量 优先 ”收集 器 。 除 
上 述 两 个 参数 之 外 ，Parallel Scavenge 收集 器 还 有 一 个 参数 -XX:+UseAdaptiveSizePolicy 值得 关 
注 。 这 是 一 个 开关 参数 ， 当 这 个 参数 打开 后 ， 就 不 需要 手工 指定 新 生 代 的 大 小 (-Xmn)、Eden 与 
Survivor 区 的 比例 (-XX:SurvivorRatio)、 普 升 老生 代 对 象 年 龄 (-XX:PretenureSizeThreshold) 等 细节 
参数 了 ， 虚 拟 机 会 根据 当前 系统 的 运行 情况 收集 性 能 监控 信息 ， 动 态 调整 这 些 参数 以 提供 最 合 
适 的 停顿 时 间或 最 大 的 吞吐 量 , 这 种 调节 方式 称 为 垃圾 收集 自 适应 的 调节 策略 (GC Ergonomics). 
如 果 读 者 对 于 收集 器 运作 原理 不 太 了 解 , 手工 优化 存在 困难 的 时 候 ， 使 用 Parallel Scavenge 收集 
器 配合 自 适 应 调节 策略 ， 把 内 存 管 理 的 调 优 任务 交 给 虚拟 机 去 完成 将 是 一 个 很 不 错 的 选择 。 只 
需要 把 基本 的 内 存 数据 设置 好 (如 -Xmx 设置 最 大 堆 )， 然 后 使 用 MaxGCPauseMillis 参数 (更 关注 
最 大 停顿 时 间 ) 或 GCTimeRatio 参数 (更 关注 吞吐 量 ) 给 虚拟 机 设立 一 个 优化 目标 ， 那 具体 细节 参 
数 的 调节 工作 就 由 虚拟 机 完成 了 。 自 适应 调节 策略 也 是 Parallel Scavenge 收集 器 与 ParNew 收集 
器 的 一 个 重要 区 别 。 


9.3.4 Serial Old 收集 器 


Serial Old 是 Serial 收集 器 的 老生 代 版 本 ， 它 同样 是 一 个 单线 程 收集 器 ， 使 用 “标记 -整理 ” 
算法 。 这 个 收集 器 的 主要 意义 是 被 Client 模式 下 的 虚拟 机 使 用 。 如 果 在 Server 模式 下 ， 它 主要 
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还 有 两 大 用 途 : 一 个 是 在 IDK 1.5 及 之 前 的 版 本 中 与 Parallel Scavenge 收集 器 搭配 使 用 ， 另 外 一 
个 就 是 作为 CMS 收集 器 的 后 备 预案 ， 在 并 发 收集 发 生 Concurrent Mode Failure 的 时 候 使 用 。 


9.3.5 Parallel Old 收集 器 


Parallel Old 是 Parallel Scavenge 收集 器 的 老生 代 版 本 ， 使 用 多 线程 和 标记 -整理 算法 。 这 个 
收集 器 是 在 JDK 1.6 中 才 开始 提供 的 ， 在 此 之 前 ， 新 生 代 的 Parallel Scavenge 收集 器 一 直 处 于 比 
较 爆 粹 的 状态 。 这 主要 是 因为 ， 如 果 新 生 代 选择 了 Parallel Scavenge 收集 器 ， 老 生 代 除 了 Serial 
OId(PS MarkSweep) 收 集 器 外 别 无 选择 (前 面 说 过 Parallel Scavenge 收集 器 无 法 与 CMS 收集 器 配 
合 工作 )。 由 于 单线 程 的 老年 代 Serial Old 收集 器 在 服务 端 应 用 性 能 上 的 “拖累 ”， 即 便 使 用 了 
Parallel Scavenge 收集 器 也 未 必 能 在 整体 应 用 上 获得 吞吐 量 最 大 化 的 效果 ， 又 因为 老生 代 收 集中 
无 法 充分 利用 服务 器 多 CPU 的 处 理 能 力 ， 在 老生 代 很 大 而 且 硬件 比较 高 级 的 环境 中 ， 这 种 组 合 
的 吞吐 量 甚至 还 不 一 定 有 ParNew 加 CMS 的 组 合 “ 给 力 ”。 

直到 Parallel Old 收集 器 出 现 后 , “吞吐 量 优先 ”收集 器 终于 有 了 比较 名 副 其 实 的 应 用 组 合 ， 
在 注重 吞吐 量 及 CPU 资源 敏感 的 场合 ,都 可 以 优先 考虑 Parallel Scavenge 加 Parallel Old 收集 器 。 


9.3.6 CMS 收集 器 


CMS(Concurrent Mark Sweep) 收 集 器 是 一 种 以 获取 最 短 回收 停顿 时 间 为 目标 的 收集 器 。 目 前 
很 大 一 部 分 的 Java 应 用 都 集中 在 互联 网 站 或 B/S 系统 的 服务 器 端 上 ， 这 类 应 用 尤其 重视 服务 器 
的 响应 速度 ， 希 望 系统 停顿 时 间 最 短 ， 以 便 给 用 户 带 来 较 好 的 体验 。CMS 收集 器 就 非常 符合 
类 应 用 的 需求 。 

从 名 字 ( 包 含 “Mark Sweep”) 上 就 可 以 看 出 CMS 收集 器 是 基于 标记 -清除 算法 实现 的 ， 它 
的 运作 过 程 相 对 于 前 面 几 种 收集 器 来 说 要 更 复杂 一 些 ， 整 个 过 程 分 为 4 个 步 又 。 

O ”初始 标记 (CMS initial mark). 

O 并 发 标记 (CMS concurrent mark) 

口 重新 标记 (CMS remark)。 

O ”并 发 清除 (CMS concurrent sweep). 

初始 标记 、 重 新 标记 这 两 个 步骤 仍然 需要 “Stop The World”。 初 始 标记 仅仅 只 是 标记 一 下 
GC Roots 能 直接 关联 到 的 对 象 ， 速 度 很 快 ， 并 发 标记 阶段 就 是 进行 GC Roots Tracing 的 过 程 。 
而 重新 标记 阶段 则 是 为 了 修正 并 发 标记 期 间 ， 因 用 户 程序 继续 运作 而 导致 标记 产生 变动 的 那 一 
部 分 对 象 的 标记 记录 。 这 个 阶段 的 停顿 时 间 一 般 会 比 初始 标记 阶段 稍 长 一 些 ， 但 远 比 并 发 标记 
的 时 间 短 。 

由 于 在 整个 过 程 中 耗 时 最 长 的 并 发 标记 和 并 发 清除 过 程 中 ， 收 集 器 线程 都 可 以 与 用 户 线程 
一 起 工作 。 所 以 从 总 体 上 来 说 , CMS 收集 器 的 内 存 回收 过 程 是 与 用 户 线 程 一 起 并 发 地 执行 的 。 

CMS 收集 器 是 一 款 优秀 的 收集 器 ， 它 的 最 主要 优点 在 名 字 上 已 经 体现 出 来 了 : 并 发 收集 、 
低 停顿 。Sun 公司 的 一 些 官方 文档 里 面 也 称 之 为 并 发 低 停顿 收集 器 (Concurrent Low Pause 
Collector)。 但 是 CMS 还 远 达 不 到 完美 的 程度 ， 它 有 以 下 三 个 显著 的 缺点 。 

(1) CMS 收集 器 对 CPU 资源 非常 敏感 。 其 实 ， 面 向 并 发 设计 的 程序 都 对 CPU 资源 比较 敏 
感 。 在 并 发 阶段 , 它 虽然 不 会 导致 用 户 线程 停顿 , 但 是 会 因为 占用 了 一 部 分 线程 (或 者 说 CPU VE 
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源 ) 而 导致 应 用 程序 变 慢 , 总 吞吐 量 会 降低 。 CMS 收集 器 默认 启动 的 回收 线程 数 是 (CPU 数量 +3)/ 
4, 也 就 是 说 当 CPU 在 4 个 以 上 时 , 并 发 回收 时 垃圾 收集 线程 最 多 占用 不 超过 25% 的 CPU 资源 。 
但 是 当 CPU 不 足 4 个 时 (譬如 2 个 ), 那么 CMS 收集 器 对 用 户 程序 的 影响 就 可 能 会 变 得 很 大 , 如 
果 CPU 负载 本 来 就 比较 大 ， 还 要 分 出 一 半 的 运算 能 力 去 执行 收集 器 线程 ， 就 可 能 导致 用 户 程序 
的 执行 速度 忽然 降低 了 50%， 这 也 很 让 人 受 不 了 。 为 了 解决 这 个 问题 ， 虚 拟 机 提供 了 一 种 称 为 
“ 增 量 式 并 发 收集 器 ”(Incremental Concurrent Mark Sweep / CMS) 的 CMS 收集 器 变种 ， 所 做 的 
事情 和 单 CPU 年 代 PC 操作 系统 使 用 抢占 式 来 模拟 多 任务 机 制 的 思想 一 样 ， 就 是 在 并 发 标记 和 
并 发 清理 时 让 垃圾 收集 线程 、 用 户 线程 交替 运行 ， 尽 量 减 少 垃圾 收集 线程 的 独占 资源 的 时 间 ， 
这 样 做 虽然 会 使 整个 垃圾 收集 的 过 程 变 长 ， 但 对 用 户 程序 的 影响 就 会 显得 少 一 些 ， 速 度 下 降 也 
就 没有 那么 明显 ,但 是 目前 版 本 中 ,i-CMS 已 经 被 声明 为 “deprecated”， 即 不 再 提倡 用 户 使 用 。 

(2) CMS 收集 器 无 法 处 理 浮动 垃圾 (Floating Garbage)， 可 能 出 现 “Concurrent Mode Failure” 
失败 而 导致 男 一 次 Full GC 的 产生 。 由 于 CMS 收集 器 并 发 清理 阶段 用 户 线程 还 在 运行 着 ， 伴 随 
程序 的 运行 自然 还 会 有 新 的 垃圾 不 断 产生 ， 这 一 部 分 垃圾 出 现在 标记 过 程 之 后 ，CMS 收集 器 无 
法 在 本 次 收集 中 处 理 掉 它们 ， 只 好 留待 下 一 次 垃圾 收集 时 再 将 其 清理 掉 。 这 一 部 分 垃圾 就 称 为 

“浮动 垃圾 ”。 也 是 由 于 在 垃圾 收集 阶段 用 户 线程 还 需要 运行 ， 即 还 需要 预 留 足够 的 内 存 空间 
给 用 户 线 程 使 用 , 因此 CMS 收集 器 不 能 像 其 他 收集 器 那样 等 到 老生 代 几 乎 完全 被 填 满 了 再 进行 
收集 ， 需 要 预 留 一 部 分 空间 提供 并 发 收集 时 的 程序 运作 使 用 。 在 默认 设置 下 ，CMS 收集 器 在 老 
生 代 使 用 了 68% 的 空间 后 就 会 被 激活 ， 这 是 一 个 偏 保守 的 设置 ， 如 果 在 应 用 中 老生 代 的 增长 不 
是 太 快 ， 可 以 适当 调 高 参数 -XX:CMSInitiatingOccupancyFraction 的 值 来 提高 触发 百分比 ， 以 便 
降低 内 存 回收 的 次 数 以 获取 更 好 的 性 能 。 要 是 CMS 收集 器 运行 期 间 预 留 的 内 存 无 法 满足 程序 需 
要 ， 就 会 出 现 一 次 “Concurrent Mode Failure” 失 败 ， 这 时 候 虚 拟 机 将 启动 后 备 预案 : 临时 启用 
Serial Old 收集 器 来 重新 进行 老生 代 的 垃圾 收集 ， 但 这 样 做 会 使 停顿 时 间 延 长 。 所 以 说 参数 
-XX:CMSInitiatingOccupancyFraction 设置 得 太 高 将 会 很 容易 导致 大 量 “Concurrent Mode Failure” 
失败 ， 性 能 反而 降低 。 

(3) 还 有 最 后 一 个 缺点 ， 在 本 节 在 开头 说 过 ，CMS 收集 器 是 一 款 基 于 “标记 -清除 ”算法 
实现 的 收集 器 ， 如 果 读 者 对 这 种 算法 还 有 印象 的 话 ， 就 可 能 想到 这 意味 着 收集 结束 时 会 产生 大 
量 的 空间 碎片 。 空 间 碎 片 过 多 时 ， 将 会 给 大 对 象 分 配 带 来 很 大 的 麻烦 ， 往 往 会 出 现 老 生 代 还 有 
很 大 的 空间 剩余 ， 但 是 无 法 找到 足够 大 的 连续 空间 来 分 配 当前 对 象 ， 不 得 不 提前 触发 一 次 Full 
GC。 为 了 解决 这 个 问题 ,CMS 收集 器 提供 了 一 个 -XX:+UseCMSCompactAtFullCollection Jf KE 
数 ， 用 于 在 “享受 ” 完 Full GC 服务 后 额外 免费 附送 一 个 碎片 整理 过 程 ， 内 存 整 理 的 过 程 是 无 法 
并 发 的 。 空 间 碎 片 问题 没有 了 ， 但 停顿 时 间 不 得 不 变 长 了 。 虚 拟 机 设计 者 们 还 提供 了 另外 一 个 
参数 -XX:CMSFullGCsBeforeCompaction， 这 个 参数 用 于 设置 在 执行 多 少 次 不 压缩 的 Full GC 后 ， 
跟着 来 一 次 带 压缩 的 。 


9.3.7 G1 收集 器 


Gl(Garbage First) 收 集 器 是 当前 收集 器 技术 的 最 前 沿 成 果 ， 在 IDK 1.6 Updatel4 中 提供 了 
Early Access 版 本 的 G1 收集 器 以 供 试用 。 在 将 来 JDK 1.7 正式 发 布 时 ，G1 收集 器 很 可 能 会 有 一 
个 成 熟 的 商用 版 本 随 之 发 布 。 这 里 只 对 GI 收集 器 进行 简单 介绍 。 

G1 收集 器 是 垃圾 收集 器 理论 进一步 发 展 的 产物 ， 它 与 前 面 的 CMS 收集 器 相 比 有 两 个 显著 
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的 改进 : 一 个 是 G1 收集 器 是 基于 标记 -整理 算法 实现 的 收集 器 , 也 就 是 说 它 不 会 产生 空间 碎片 ， 


这 对 于 长 时 间 运 行 的 应 用 系统 来 说 非常 了 


和 要。 一 个 是 它 可 以 非常 精确 地 控制 停顿 ， 既 能 让 使 用 


者 明确 指定 在 一 个 长 度 为 M 毫秒 的 时 间 片 段 内 ,消耗 在 垃圾 收集 上 的 时 间 不 得 超过 N 毫秒 ,这 
几乎 已 经 是 实时 Java(RTSJ 的 垃圾 收集 器 的 特征 了 。 


G1 收集 器 可 以 实现 在 基本 不 牺牲 吞吐 量 的 前 提 下 完成 低 停顿 的 内 存 回收 ， 这 是 由 于 


26b 
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极力 地 避免 全 区 域 的 垃圾 收集 ， 之 前 的 收集 器 进行 收集 的 范围 都 是 整个 新 生 代 或 老生 代 ， 而 G1 
收集 器 将 整个 Java 堆 ( 包 括 新 生 代 、 老 生 代 ) 划 分 为 多 个 大 小 固定 的 独立 区 域 (Region)， 并 且 跟 踪 
这 些 区 域 里 面 的 垃圾 堆积 程度 ， 在 后 台 维 护 一 个 优先 列表 ， 每 次 根据 允许 的 收集 时 间 ， 优 先 回 
收 垃圾 最 多 的 区 域 (这 就 是 Garbage First 名 称 的 来 由 )。 区 域 划分 及 有 优先 级 的 区 域 回收 ， 保 证 了 
G1 收集 器 在 有 限 的 时 间 内 可 以 获得 最 高 的 收集 效率 。 


9.3.8 垃圾 收集 器 参数 总 结 


JDK 1.6 中 的 各 种 垃圾 收集 器 到 此 已 全 部 介绍 完毕 , 在 描述 过 程 中 提 到 了 很 多 虚拟 机 非 稳定 
的 运行 参数 ， 表 9-1 整理 了 这 些 参 数 以 供 读者 实践 时 参考 。 


表 9-1 垃圾 收集 相关 的 常用 参数 


5 数 Ha 述 

TRE 虚拟 机 运行 在 Client 模式 下 的 默认 值 ， 打 开 此 开关 后 ， 使 用 Serial +Serial 
Old 的 收集 器 组 合 进行 内 存 回收 

UseParNewGC 打开 此 开关 后 ， 使 用 ParNew + Serial Old 的 收集 器 组 合 进行 内 存 回收 
打开 此 开关 后 ， 使 用 ParNew + CMS + Serial Old 的 收集 器 组 合 进行 内 存 回 

UseConcMarkSweepGC | 收 。Serial Old 收集 器 将 作为 CMS 收集 器 出 现 Concurrent Mode Failure 失 
败 后 的 后 备 收集 器 使 用 

— 虚拟 机 运行 在 Server 模式 下 的 默认 值 ， 打 开 此 开关 后 ， 使 用 Parallel 
Scavenge + Serial Old(PS MarkSweep) 的 收集 器 组 合 进行 内 存 回收 
打开 此 开关 后 ， 使 用 Parallel Scavenge + Parallel Old 的 收集 器 组 合 进行 内 

UseParallelOldGC 
存 回 收 

新 生 代 中 Eden 区 域 与 Survivor 区 域 的 容量 比值 ， 默 认为 8， 代 表 Eden : 

SurvivorRatio H 
Survivor -8 : 1 

E 直接 晋升 到 老生 代 的 对 象 大 小 ， 设 置 这 个 参数 后 ， 大 于 这 个 参数 的 对 象 将 
直接 在 老生 代 分 配 

MaxTemuringThreshold 晋升 到 老生 代 的 对 象 年 龄 。 每 个 对 象 在 坚持 过 一 次 Minor GC 后 , 年 龄 就 加 
1， 当 超过 这 个 参数 值 时 就 进入 老生 代 

UseAdaptiveSizePolicy | 动态 调整 Java 堆 中 各 个 区 域 的 大 小 以 及 进入 老生 代 的 年 龄 

—-——— 是 否 允许 分 配 担保 失败 ， 即 老生 代 的 剩余 空间 不 足以 应 付 新 生 代 的 整个 
Eden 和 Survivor 区 的 所 有 对 象 都 存活 的 极端 情况 

ParallelGCThreads 设置 并 行 GC 时 进行 内 存 回收 的 线程 数 

GC 时 间 占 总 时 间 的 比率 ， 默 认 值 为 99， 即 允许 1% 的 GC 时 间 。 仅 在 使 
GCTimeRatio 


用 Parallel Scavenge 收集 器 时 生效 


<D 


Er 
参 数 j& xk 

MaxGCPauseMillis 设置 垃圾 收集 的 最 大 停顿 时 间 。 仅 在 使 用 Parallel Scavenge 收集 器 时 生效 
CMSInitiatingOccupancy | 设置 CMS 收集 器 在 老年 代 空 间 被 使 用 多 少 后 触发 垃圾 收集 。 默 认 值 为 
Fraction 68%， 仅 在 使 用 CMS 收集 器 时 生效 
UseCMSCompactAtFull | 设置 CMS 收集 器 在 完成 垃圾 收集 后 是 否 要 进行 一 次 内 存 碎 片 整理 。 仅 在 
Collection 使 用 CMS 收集 器 时 生效 
CMSFullGCsBeforeCom | 设置 CMS 收集 器 在 进行 若干 次 垃圾 收集 后 再 启动 一 次 内 存 碎片 整理 。 仅 
paction 在 使 用 CMS 收集 器 时 生效 


9.4 Android 中 的 垃圾 回收 


垃圾 回收 机 制 比较 重要 ， 能 够 达到 节约 内 存 的 目的 ， 并 最 终 提 高 手机 的 处 理 效率 。 本 节 将 
简单 讲解 Android 中 的 垃圾 回收 机 制 。 


9.4.1 sp 和 wp 简 析 


在 Android 中 ，sp 和 wp 被 称 为 智能 指针 (android refbase 类 (sp 和 wp))。 其 实 sp 和 wp 就 是 
Android 为 其 C++ 实现 的 自动 垃圾 回收 机 制 。 如 果 具 体 到 内 部 实现 ，sp 和 wp 实际 上 只 是 一 个 实 
现 垃圾 回收 功能 的 接口 而 已 ， 比 如 说 对 夫 ， 一 > 的 重 载 ， 是 为 了 其 看 起 来 像 真 正 的 指针 一 样 ， 而 
真正 实现 垃圾 回收 的 是 refbase 这 个 基 类 。 这 部 分 代码 位 与 如 下 文件 中 。 


/frameworks/base/include/utils/RefBase.h 


在 此 所 有 的 类 都 会 虚 继承 于 refbase 类 ， 因 为 它 实 现 了 达到 Android 垃圾 回收 所 需要 的 所 有 
功能 ， 因 此 实际 上 所 有 的 对 象 声 明 出 来 以 后 都 具备 了 自动 释放 自己 的 能 力 ， 也 就 是 说 实际 上 智 
能 指针 就 是 我 们 的 对 象 本 身 ， 它 会 维持 一 个 对 本 身 强 引用 和 弱 引 用 的 计数 ,一 旦 强 引用 计数 为 0 
它 就 会 释放 掉 自 己 。 

(1) sp 

sp 不 是 smart pointer 的 缩写 ， 而 是 strong pointer 的 缩写 ， 它 实际 上 就 是 内 部 包含 了 一 个 指 
向 对 象 的 指针 而 已 。sp 的 一 个 构造 函数 如 下 。 

template< typename T> 
sp< T>::sp(T* other) 
: m_ptr (other) 


{ 


if (other) other->incStrong(this) ; 


比如 说 我 们 声明 如 下 的 一 个 对 象 。 


sp< CameraHardwareInterface> hardware (new CameraHal()); 


实际 上 sp 指针 对 本 身 没有 进行 什么 操作 ， 就 是 对 一 个 指针 的 基本 赋值 操作 ， 包 含 了 一 个 指 
向 对 象 的 指针 , 但 是 对 象 会 对 对 象 本 身 增 加 一 个 强 引用 计数 , 这 个 incStrong 的 实现 就 在 refbase 
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类 里 。 新 产生 出 来 一 个 CameraHal 对 象 ， 将 它 的 值 给 sp< CameraHardwareInterface> 时 ， 它 的 强 
引用 计数 就 会 从 0 变 为 1。 因 此 每 次 将 对 象 赋值 给 一 个 sp 指针 时 ， 对 象 的 强 引用 计数 都 会 加 1， 
sp 的 析 构 函数 如 下 。 

template< typename T> 

sp< T>::~sp() 


{ 


if (m ptr) m_ptr->decStrong(this) ; 


实际 上 每 次 删除 一 个 sp 对 象 时 ，sp 指针 指向 的 对 象 的 强 引用 计数 就 会 减 1， 当 对 象 的 强 引 
用 技术 为 0 时， 这 个 对 象 就 会 被 自动 释放 掉 。 
Q) wp 
我 们 再 看 wp, wp 就 是 weak pointer 的 缩写 。 弱 引用 指针 的 原理 ， 就 是 为 了 应 用 Android 3 
圾 回收 来 减少 对 那些 胖子 对 象 对 内 存 的 占用 ，wp 的 一 个 构造 函数 如 下 。 
wp< T»::wp(T* other) 
: m_ptr (other) 


{ 


if (other) m refs = other-»createWeak (this); 


它 和 sp 一 样 ， 实 际 上 也 就 是 仅仅 对 指针 进行 了 赋值 而 已 ， 对 象 本 身 会 增加 一 个 对 自身 的 弱 
引用 计数 ， 同 时 wp 还 包含 一 个 m_ref 指针 ， 这 个 指针 主要 是 用 来 将 wp 升级 为 sp 时 候 使 用 的 。 


template< typename T> 
sp< T> wp< T>::promote() const 


return sp« T»(m ptr, m refs); 

} 

template< typename T> 

Sp« T>::sp(T* p, weakref type* refs) 

: m ptr((p && refs-»attemptIncStrong(this)) ? p : 0) 
{ 

} 


实际 上 我 们 对 wp 指针 唯一 能 做 的 就 是 将 wp 指针 升级 为 一 个 sp 指针 ， 然 后 判断 其 是 否 升 
级 成 功 。 如 果 成 功 则 说 明 对 象 依旧 存在 ， 如 果 失 败 则 说 明 对 象 已 经 被 释放 掉 了 。wp 指针 在 单 例 
中 使 用 得 很 多 ， 确 保 mhardware 对 象 只 有 一 个 ， 代 码 如 下 。 


wp< CameraHardwareInterface» CameraHardwareStub::singleton; 
sp< CameraHardwareInterface» CameraHal::createInstance() 


LOG FUNCTION NAME 

if (singleton !- 0) { 

sp< CameraHardwareInterface» hardware = singleton.promote() ; 

if (hardware !- 0) { 

return hardware; 

} 

} 

sp< CameraHardwareInterface» hardware(new CameraHal()); // 强 引用 加 1 
singleton = hardware;// 弱 引用 加 1 

return hardware;// 赋 值 构造 函数 ， 强 引用 加 1 
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} 
//hardware 被 删除 ， 强 引用 减 1 


9.4.2 详解 智能 指针 (android refbase 类 (sp 和 wp)) 


在 Android 的 源 代码 中 ,经 常会 看 到 如 sp<xxx>、wp<xxx> 形 式 的 类 型 定义 ,这 其 实 是 Android 
中 的 智能 指针 。 智 能 指针 是 C++ 中 的 一 个 概念 ， 通 过 基于 引用 计数 的 方法 ， 解 决 对 象 的 自动 释 
放 的 问题 。 在 C++ 的 编程 中 ， 有 两 个 很 让 人 头痛 的 问题 : 一 个 是 忘记 释放 动态 申请 的 对 象 从 而 
造成 内 存 泄漏 ， 另 一 个 是 对 象 在 一 个 地 方 释放 后 ， 又 在 别 的 地 方 被 使 用 ， 从 而 引起 内 存 访问 错 
误 。 程 序 员 往往 需要 花费 很 大 精力 进行 设计 ， 以 避免 这 些 问 题 的 出 现 。 在 使 用 智能 指针 后 ， 动 
态 申请 的 内 存 将 会 被 自动 释放 (有 点 类 似 Java 的 垃圾 回收 )， 不 需要 再 使 用 delete 来 释放 对 象 ， 
也 不 需要 考虑 一 个 对 象 是 否 已 经 在 其 他 地 方 被 释放 了 ， 从 而 使 程序 编写 的 工作 量 减轻 不 少 ， 而 
使 程序 的 稳定 性 得 到 大 大 提高 。 

Android 的 智能 指针 相关 的 源 代码 在 如 下 两 个 文件 中 。 


frameworks/base/include/utils/RefBase.h 
frameworks/base/libs/utils/RefBase.cpp 


涉及 的 类 以 及 类 之 间 的 关系 如 图 9-2 所 示 。 


-mBase 


9-2 智能 指针 相关 类 的 关系 


Android 中 定义 了 两 种 智能 指针 类 型 ,一 种 是 强 指针 sp(strong pointer), 另 一 种 是 弱 指针 (weak 
pointeD 。 其 实 称 为 强 引 用 和 弱 引 用 更 合适 一 些 。 强 指针 与 一 般 意义 的 智能 指针 概念 相同 ， 通 过 
引用 计数 来 记录 有 多 少 使 用 者 在 使 用 一 个 对 象 ， 如 果 所 有 使 用 者 都 放弃 了 对 该 对 象 的 引用 ， 则 
该 对 象 将 被 自动 销毁 。 

弱 指 针 也 指向 一 个 对 象 ， 但 是 弱 指针 仅仅 记录 该 对 象 的 地 址 ， 不 能 通过 弱 指针 来 访问 该 对 
象 ， 也 就 是 说 不 能 通过 弱 指针 来 调用 对 象 的 成 员 函 数 或 访问 对 象 的 成 员 变 量 。 要 想 访 问 弱 指针 
所 指向 的 对 象 ， 需 首先 将 弱 指针 升级 为 强 指针 (通过 wp 类 所 提供 的 promote0 方 法 )。 弱 指针 所 指 
向 的 对 象 是 有 可 能 在 其 他 地 方 被 销毁 的 , 如 果 对 象 已 经 被 销毁 , wp 的 promote0 方 法 将 返回 空 指 
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针 ， 这 样 就 能 避免 出 现 地 址 访问 错误 的 情况 。 

究竟 指针 是 怎么 做 到 这 一 点 的 呢 ? 其 实 一 点 也 不 复杂 , 每 一 个 可 以 被 智能 指针 引用 的 对 象 ， 
都 同时 被 附加 了 另外 一 个 weakref impl 类 型 的 对 象 ， 这 个 对 象 负责 记录 对 象 的 强 指针 引用 计数 
和 弱 指 针 引 用 计数 。 这 个 对 象 是 智能 指针 的 实现 内 部 使 用 的 ， 智 能 指针 的 使 用 者 看 不 到 这 个 对 
象 。 弱 指针 操作 的 就 是 这 个 对 象 ， 只 有 当 强 引用 计数 和 弱 引 用 计数 都 为 0 时 ， 这 个 对 象 才 会 被 
销毁 。 

接 下 来 开始 分 析 到 底 该 怎么 使 用 智能 指针 。 假设 现在 有 一 个 类 MyClass, 如 果 要 使 用 智能 指 
针 来 引用 这 个 类 的 对 象 ， 那 么 这 个 类 需 满足 下 列 两 个 前 提 条 件 。 

(1) 这 个 类 是 基 类 RefBase 的 子 类 或 间接 子 类 。 

Q) 这 个 类 必须 定义 虚构 造 函 数 ， 即 它 的 构造 函数 需要 进行 如 下 定义 。 

virtual -MyClass(); 


满足 了 上 述 条 件 的 类 后 就 可 以 定义 智能 指针 ， 定 义 方法 和 普通 指针 类 似 。 比 如 普通 指针 的 
定义 如 下 。 

MyClass* p obj; 

智能 指针 是 这 样 定义 的 。 

sp<MyClass> p obj; 

注意 不 要 定义 成 sp<MyClass>* p_obj。 初 学 者 容易 犯 这 种 错误 ， 这 样 实际 上 相当 于 定义 了 
一 个 指针 的 指针 。 尽 管 在 语法 上 没有 问题 ， 但 是 最 好 永远 不 要 使 用 这 样 的 定义 。 

定义 了 一 个 智能 指针 的 变量 ， 就 可 以 像 使 用 普通 指针 那样 使 用 它 ， 包 括 赋值 、 访 问 对 象 成 
员 、 作 为 函数 的 返回 值 、 作 为 函数 的 参数 等 ， 代 码 如 下 。 

p obj = new MyClass(); // 注意 不 要 写成 p_obj = new sp<MyClass> 

sp«MyClass» p obj2 - p obj; 

p obj-»func(); 

p obj = create obj(); 

some func(p obj); 

注意 不 要 试图 删除 (delete) 一 个 智能 指针 ， 即 delete p_obj。 不 要 担心 对 象 的 销毁 问题 ， 智 能 
指针 的 最 大 作用 就 是 自动 销毁 不 再 使 用 的 对 象 。 不 需要 再 使 用 一 个 对 象 后 ， 直 接 将 指针 赋值 为 
NULL 即 可 : 

p obj = NULL; 


上 面 说 的 都 是 强 指针 ， 弱 指针 的 定义 方法 和 强 指针 类 似 ， 但 是 不 能 通过 弱 指 针 来 访问 对 象 
的 成 员 。 下 面 是 弱 指 针 的 示例 : 

wp«MyClass» wp obj = new MyClass(); 

p obj = wp obj.promote(); // 升级 为 强 指针 。 不 过 这 里 要 用 .而 不 是 -> 

wp obj = NULL; 

由 此 可 见 ， 智 能 指针 使 用 起 来 是 很 方便 的 ,在 一 般 情况 下 最 好 用 智能 指针 来 代替 普通 指针 。 
但 是 需要 知道 一 个 智能 指针 其 实 是 一 个 对 象 ， 而 不 是 一 个 真正 的 指针 ， 因 此 其 运行 效率 是 远 远 
比 不 上 普通 指针 的 。 所 以 在 对 运行 效率 敏感 的 地 方 ， 最 好 还 是 不 要 使 用 智能 指针 为 好 。 
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9.5 Dalvik 垃圾 收集 的 三 种 算法 


垃圾 收集 是 Dalvik 虚拟 机 内 存 管 理 的 核心 ， 垃 圾 收集 的 性 能 在 很 大 程度 上 影响 了 一 个 Java 
程序 内 存 使 用 的 效率 。 顾 名 思 义 ， 垃 圾 收集 就 是 收集 垃圾 内 存 加 以 回收 。 在 垃圾 回收 技术 里 ， 
经 典 的 算法 主要 有 以 下 三 种 。 

Q “引用 计数 。 

口 MarkSweep 算法 。 

m SemiSpaceCopy 算法 。 

其 他 算法 或 者 混合 以 上 三 种 法 来 使 用 ， 根 据 不 同 的 场合 来 选择 不 同 的 算法 。 


9.5.1 引用 计数 


这 种 技术 非常 简单 , 就 是 使 用 一 个 变量 记录 这 块 内 存 或 者 对 象 的 使 用 次 数 。 比 如 在 COM 技 
术 里 ， 就 是 使 用 引用 计数 来 确认 这 个 COM 对 象 是 什么 时 候 删 除 的 。 当 一 个 COM 对 象 给 不 同 线 
程 来 使 用 时 ， 由 于 不 同 的 线程 生命 周期 不 一 样 ， 因此， 没有 办 法 知道 这 个 COM 对 象 到 底 在 哪个 
线程 删除 ， 只 能 使 用 引用 计数 来 删除 ， 和 否则 还 需要 不 同 线程 之 间 添 加 同步 机 制 ， 这 样 是 非常 麻 
烦 和 复杂 的 ， 如果 COM 对 象 有 很 多 ， 就 变 成 基本 上 不 能 实现 了 。 引 用 计数 的 优点 是 : 在 对 象 变 
成 垃圾 时 ， 可 以 马上 进行 回收 ， 回 收效 率 和 成 本 都 是 最 低 。 因 此 ， 内 存 的 使 用 率 最 高 ， 基 本 上 
没有 时 间 花 费 , 不 需要 把 所 有 访问 COM 对 象 线程 都 停 下 来 。 其 缺点 是 : 引用 计数 会 影响 执行 效 
率 , 每 引用 一 次 都 需要 更 新 引用 计数 ， 对 于 COM 对 象 是 由 人 工控 制 的 ， 因 此 引用 次 数 很 少 ， 没 
有 什么 影响 。 但 在 Java 里 是 由 编译 程序 来 控制 的 ， 因 此 引用 次 数 非常 多 。 另 外 一 个 问题 就 是 引 
用 计数 不 能 解决 交叉 引用 ， 或 者 环形 引用 的 问题 。 比 如 在 一 个 环形 链表 里 ， 每 一 个 元 素 都 引用 
前 面 的 元 素 ， 这 样 首尾 相连 的 链表 ， 当 所 有 元 素 都 变 成 不 需要 时 ， 就 没有 办 法 识别 出 来 ， 并 进 
行内 存 回收 。 


9.5.2 Mark Sweep 算法 


该 算法 又 被 称 为 标记 -清除 算法 ,依赖 于 对 所 有 存活 对 象 进行 一 次 全 局 遍历 来 确定 哪些 对 象 
可 以 回收 ， 遍 历 的 过 程 从 根 出 发 ， 找 到 所 有 可 到 达 对 象 ， 其 他 不 可 到 达 的 对 象 就 是 垃圾 对 象 ， 
可 被 回收 。 正 如 其 名 称 所 暗示 的 那样 ， 这 个 算法 分 为 两 大 阶段 : 标记 和 清除 。 这 种 分 步 执行 的 
思路 构成 了 现代 垃圾 收集 算法 的 思想 基础 。 与 引用 计数 算法 不 同 的 是 ， 标 记 - 清 除 算法 不 需要 监 
测 每 一 次 内 存 分 配 和 指针 操作 ， 只 需要 在 标记 阶段 进行 一 次 统计 就 行 了 。 标 记 -清除 算法 可 以 非 
常 自然 地 处 理 环形 问题 ， 另 外 在 创建 对 象 和 销毁 对 象 时 少 了 操作 引用 计数 值 的 开销 。 不 过 “ 标 
记 -清除 ”算法 也 有 一 个 缺点 ， 就 是 需要 标记 和 清除 阶段 中 把 所 有 对 象 停止 执行 。 在 垃圾 回收 器 
运行 过 程 中 ， 应 用 程序 必须 暂时 停止 ， 并 等 到 垃圾 回收 器 全 部 运行 完成 后 ， 才 能 重新 启动 应 用 
程序 运行 。 

Dalvik 虚拟 机 最 常用 的 算法 便 是 Mark Sweep 算法 ， 该 算法 一 般 分 Mark 阶段 (标记 出 活动 对 
B), Sweep 阶段 (回收 垃圾 内 存 ) 和 可 选 的 Compact 阶段 (减少 堆 中 的 碎片 )。Dalvik 虚拟 机 的 实现 
不 进行 可 选 的 Compact 阶段 。 


Q» 


第 9 章 垃圾 收集 


(1) Mark 阶段 

垃圾 收集 的 第 一 步 是 标记 出 活动 对 象 ， 因 为 没有 办 法 识别 那些 不 可 访问 的 对 象 
(unreachableobjects), 因此 只 能 标记 出 活动 对 象 , 这 样 所 有 未 被 标记 的 对 象 就 是 可 以 回收 的 垃圾 。 

@， 根 集合 RootSeb。 

当 进 行 垃圾 收集 时 ， 需 要 停止 Dalvik 虚拟 机 的 运行 (当然 ， 除 了 垃圾 收集 以 外 )。 因 此 垃圾 
收集 又 被 称 作 STW(Stop-The-World， 整 个 世界 因 我 而 停止 )。Dalvik 虚拟 机 在 运行 过 程 中 要 维护 
一 些 状态 信息 ， 这 些 信息 包括 : 每 个 线程 所 保存 的 寄存 器 ，Java 类 中 的 静态 字段 ， 局 部 和 全 局 
的 INI 引用 ，Java 虚拟 机 中 的 所 有 函数 调用 会 对 应 一 个 相应 的 C 栈 帧 。 每 一 个 栈 帧 里 可 能 包含 
对 象 的 引用 ， 比 如 包含 对 象 引 用 的 局 部 变量 和 参数 。 

所 有 这 些 引 用 信息 被 加 入 到 一 个 集合 中 ， 叫 根 集合 。 然 后 从 根 集合 开始 ， 递 归 的 查找 可 以 
从 根 集合 出 发 访问 的 对 象 。 因 此 ，Mark 过 程 又 被 称 为 追踪 ,追踪 所 有 可 被 访问 的 对 象 。 如 图 9-3 
所 示 ， 假 定 从 根 集合 {a} 开 始 ， 我 们 可 以 访问 的 对 象 集合 为 {ab,cd}， 这 样 就 追踪 出 所 有 可 被 访 
问 的 对 象 集合 。 


9-3 Mark 过程 


@ 标记 栈 (MarkStack) 。 

垃圾 收集 使 用 栈 来 保存 根 集 合 ， 然 后 对 栈 中 的 每 一 个 元 素 ， 递 归 追 踪 所 有 可 访问 的 对 象 ， 
对 于 所 有 可 访问 的 对 象 ， 在 markBits 位 图 中 该 将 对 象 的 内 存 起 始 地 址 对 应 的 位 设 为 1。 这 样 当 
栈 为 空 时 ，markBits 位 图 就 是 所 有 可 访问 的 对 象 集合 。 

Q) Sweep 阶段 

垃圾 收集 的 第 二 步 就 是 回收 内 存 ， 在 Mark 阶段 通过 markBits 位 图 可 以 得 到 所 有 可 访问 的 
对 象 集合 , 而 liveBits 位 图 表示 所 有 已 经 分 配 的 对 象 集合 。 因 此 通过 比较 liveBits 位 图 和 markBits 
位 图 的 差异 就 是 所 有 可 回收 的 对 象 集合 。Sweep 阶段 调用 free 方法 来 释放 这 些 内 存 给 堆 。 

(3) Concurrent Mark( 并 发 标记 ) 

为 了 运行 垃圾 收集 ， 需 要 停止 虚拟 机 的 运行 ， 这 可 能 会 导致 程序 比较 长 时 间 的 停顿 。 垃 圾 
收集 的 主要 工作 位 于 Mark 阶段 , 为 了 缩短 停顿 时 间 , Dalvik 虚拟 机 使 用 了 concurrentmark 技术 。 
concurrentmark 引入 一 个 单独 的 垃圾 收集 线程 , 由 该 线程 去 跟踪 自己 的 根 集合 中 所 有 可 访问 的 对 
象 ， 同 时 所 有 其 他 的 线程 也 在 运行 。 这 也 是 concurrent 一 词 的 含义 , 但 是 为 了 回收 内 存 ， 即 运行 
Sweep 阶段 ,必须 停止 虚拟 机 的 运行 。 这 会 导入 一 个 问题 , 即 在 垃圾 收集 线程 mark 对 象 的 时 候 ， 
其 他 线程 的 运行 又 引入 了 新 的 访问 对 象 。 因 此 在 Sweep 阶段 ， 又 重新 运行 mark 阶段 ， 但 是 在 这 
个 阶段 对 于 已 经 mark 的 对 象 来 说 ， 可 以 不 用 继续 递归 追踪 了 ， 这样 从 一 定 程度 上 降低 了 程序 的 
停顿 时 间 。 
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9.5.8 ”和 垃圾 收集 算法 有 关 的 函数 


在 源 文件 alloc/MarkSweep.h 中 定义 了 和 垃圾 收集 有 关 的 函数 , 各 个 函数 的 具体 说 明 如 下 。 
(1) 调用 函数 dvmHeapBeginMarkStepO 创 建 位 图 ， 并 从 对 象 位 图 里 复制 一 份 位 图 出 来 ， 以 


便 后 面 对 这 个 位 图 进行 标记 。 函 数 dvmHeapBeginMarkStep0 的 实现 代码 如 下 。 


dvmHeapBeginMarkStep () 
{ 
GcMarkContext *mc = &gDvm.gcHeap->markContext ; 
HeapBitmap objectBitmaps [HEAP_SOURCE MAX HEAP COUNT] ; 
size t numBitmaps; 
if (!createMarkStack(&mc-»stack)) { 
return false; 
} 
numBitmaps = dvmHeapSourceGetObjectBitmaps (objectBitmaps, 
HEAP SOURCE MAX HEAP COUNT); 
if (numBitmaps «- 0) ( 
return false; 
} 
/* Create mark bitmaps that cover the same ranges as the 
* current object bitmaps. 
xy, 
if (!dvmHeapBitmapInitListFromTemplates (mc-»bitmaps, objectBitmaps, 
numBitmaps, "mark")) 
{ 


return false; 
} 


mc-»numBitmaps = numBitmaps; 
mc-»finger - NULL; 

#if WITH OBJECT HEADERS 
gGeneration++; 

#endif 
return true; 


} 
(2) 调用 函数 dvmHeapMarkRootSetO 标 记 所 有 根 对 象 , 即 负责 标记 heap 中 的 没有 任何 引用 


连接 的 root 对 象 。 其 实现 代码 如 下 。 


> 


void dvmHeapMarkRootSet () 

{ 
HeapRefTable *refs; 
GcHeap *gcHeap; 
Object **op; 
gcHeap - gDvm.gcHeap; 
HPROF SET GC SCAN STATE(HPROF ROOT STICKY CLASS, 0); 
LOG SCAN("root class loader\n") ; 
dvmGcScanRootClassLoader () ; 
LOG_SCAN("primitive classes\n") ; 
dvmGcScanPrimitiveClasses () ; 
/* dvmGcScanRootThreadGroups() sets a bunch of 
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* different scan states internally. 

E 
HPROF CLEAR GC SCAN STATE(); 
LOG SCAN("root thread groups Wn"); 
dvmGcScanRootThreadGroups () ; 
HPROF SET GC SCAN STATE(HPROF ROOT INTERNED STRING, 0); 
LOG SCAN("interned strings\n") ; 
dvmGcScanInternedStrings () ; 
HPROF SET GC SCAN STATE(HPROF ROOT JNI GLOBAL, 0); 
LOG SCAN("JNI global refs\n") ; 
dvmGcMarkdniGlobalRefs () ; 
HPROF SET GC SCAN STATE (HPROF ROOT REFERENCE CLEANUP, 0); 
LOG SCAN("pending reference operations n"); 
dvmHeapMarkLargeTableRefs (gcHeap-»referenceOperations, true); 
HPROF SET GC SCAN STATE(HPROF ROOT FINALIZING, 0); 
LOG SCAN("pending finalizations\n") ; 
dvmHeapMarkLargeTableRefs (gcHeap-»pendingFinalizationRefs, false); 
HPROF SET GC SCAN STATE(HPROF ROOT DEBUGGER, 0); 
LOG SCAN("debugger refs\n") ; 
dvmGcMarkDebuggerRefs () ; 
HPROF SET GC SCAN STATE(HPROF ROOT VM INTERNAL, 0); 
/* Mark all ALLOC NO GC objects. 

x, 
LOG SCAN("ALLOC NO GC objects in"); 
refs - &gcHeap-»nonCollectableRefs; 
op = refs-»table; 
while ((uintptr t)op < (uintptr t)refs-»nextEntry) { 

dvmMarkObjectNonNull(* (op++) ) ; 
} 


/* Mark any special objects we have sitting around. 
e 

LOG SCAN("special objects in"); 

dvmMarkObjectNonNull (gDvm.outOfMemoryObj); 

dvmMarkObjectNonNull (gDvm.internalErrorObj); 

dvmMarkObjectNonNull (gDvm.noClassDefFoundErrorObj); 


//TODO: scan object references sitting in gDvm; use pointer begin & end 


} 
G) 


HPROF CLEAR GC SCAN STATE(); 


调用 函数 dvmHeapScanMarkedObjects0 根 据 上 一 个 函数 给 出 的 根 对 象 位 图 ， 对 每 一 个 


根 相 关 的 位 图 进行 计算 ， 如 果 这 个 根 对 象 有 被 引用 ， 就 标记 为 使 用 。 这 个 过 程 是 递归 调用 的 过 
程 ， 从 根 开 始 不 断 重复 地 对 子 树 进行 标记 的 过 程 。 函 数 dvmHeapScanMarkedObjects0 的 实现 代 


码 如 下 。 


void dvmHeapScanMarkedObjects () 


{ 


GcMarkContext *ctx = &gDvm.gcHeap-»markContext; 


assert(ctx-»finger -- NULL); 
/* The bitmaps currently have bits set for the root set. 
* Walk across the bitmaps and scan each object. 


5 
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#ifndef NDEBUG 
gLastFinger = 0; 
#endif 
dvmHeapBitmapWalkList (ctx->bitmaps, ctx->numBitmaps, 
scanBitmapCallback, ctx); 
/* We've walked the mark bitmaps. Scan anything that's 
* left on the mark stack. 
a 
processMarkStack (ctx) ; 
LOG SCAN("done with marked objects\n") ; 


} 
(4) 调用 函数 dvmHeapHandleReferences() Ab f Java 类 对 象 的 引用 类 型 。 在 此 主要 处 理 如 下 


三 个 直接 子 类 。 


O SoftReference: 对 象 封装 了 对 引用 目标 的 “ 软 引用 ”。 

O WeakReference: 封装 了 对 引用 目标 的 “ 弱 引 用 ”。 

O PhantomReference: 封装 了 对 引用 目标 的 “影子 引用 ”。 强 引用 禁止 引用 目标 被 垃圾 收 
集 ， 而 软 引用 、 弱 引用 和 影子 引用 不 禁止 。 

函数 dvmHeapHandleReferencesO 的 实现 代码 如 下 。 


void dvmHeapHandleReferences (Object *refListHead, enum RefType refType) 
{ 

Object *reference; 

GcMarkContext *markContext = &gDvm.gcHeap-»markContext; 

const int offVmData - gDvm.offJavaLangRefReference vmData; 

const int offReferent - gDvm.offJavaLangRefReference referent; 

bool workRequired - false; 


size_t numCleared = 0; 
size t numEnqueued - 0; 
reference - refListHead; 
while (reference !- NULL) { 
Object *next; 
Object *referent; 


/* Pull the interesting fields out of the Reference object. 
xf 

next = dvmGetFieldObject (reference, offVmData) ; 

referent = dvmGetFieldObject (reference, offReferent); 


//TODO: when handling REF PHANTOM, unlink any references 


// that fail this initial if(). We need to re-walk 
pie the list, and it would be nice to avoid the extra 
vul work. 


if (referent !- NULL && !isMarked(ptr2chunk (referent), markContext)) ( 
bool schedClear, schedEnqueue; 


/* This is the strongest reference that refers to referent. 
* Do the right thing. 

E 

switch (refType) ( 
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case REF SOFT: 
case REF WEAK: 
schedClear = clearReference (reference); 
SchedEnqueue - enqueueReference (reference); 
break; 
case REF PHANTOM: 
/* PhantomReferences are not cleared automatically. 
Until someone clears it (or the reference itself 
is collected), the referent must remain alive. 


It's necessary to fully mark the referent because 
it will still be present during the next GC, and 
all objects that it points to must be valid. 

(The referent will be marked outside of this loop, 
after handing all references of this strength, in 
case multiple references point to the same object.) 


*o* eH eH E 


x/ 
SchedClear - false; 


/* A PhantomReference is only useful with a 
* queue, but since it's possible to create one 
* without a queue, we need to check. 
X, 
SchedEnqueue - enqueueReference (reference); 
break; 
default: 
assert(!"Bad reference type"); 
SchedClear - false; 
schedEnqueue = false; 
break; 


} 


numCleared += schedClear ? 1 : 0; 
numEnqueued «- schedEnqueue ? 1 : 0; 


if (schedClear || schedEnqueue) { 
uintptr t workBits; 


/* Stuff the clear/enqueue bits in the bottom of 
* the pointer. Assumes that objects are 8-byte 
aligned. 


is by definition already marked at this point) to 
this list; we're not adding the referent (which 
has already been cleared). 
x 
assert(((intptr t)reference & 3) -- 0); 
assert(((WORKER CLEAR | WORKER ENQUEUE) & -3) -- 0); 
workBits - (schedClear ? WORKER CLEAR : 0) | 
(schedEnqueue ? WORKER ENQUEUE : 0); 
if (!dvmHeapAddRefToLargeTable ( 
&gDvm.gcHeap-»referenceOperations, 


* 
* 
* Note that we are adding the *Reference* (which 
* 
* 
* 
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(Object *)((uintptr t)reference | workBits))) 


LOGE HEAP("dvmMalloc(): no room for any more " 
"reference operations\n") ; 
dvmAbort () ; 
} 
workRequired = true; 


} 


if (refType !- REF PHANTOM) { 
/* Let later GCs know not to reschedule this reference. 
if 
dvmSetFieldObject (reference, offVmData, 
SCHEDULED REFERENCE MAGIC); 
} // else this is handled later for REF PHANTOM 


] // else there was a stronger reference to the referent. 


reference - next; 

} 
#define refType2str(r) \ 

((r) REF SOFT ? "soft" : ( \ 

(x) REF WEAK ? "weak" : ( V 

(r) == REF PHANTOM ? "phantom" : "UNKNOWN" ))) 
LOGD HEAP("dvmHeapHandleReferences(): cleared %zd, enqueued %zd %s references\n", 
numCleared, numEnqueued, refType2str(refType) ) ; 


/* Walk though the reference list again, and mark any non-clear/marked 
* referents. Only PhantomReferences can have non-clear referents 
* at this point. 
if 
if (refType == REF_PHANTOM) { 
bool scanRequired = false; 


HPROF SET GC SCAN STATE (HPROF ROOT REFERENCE CLEANUP, 0); 
reference - refListHead; 
while (reference !- NULL) { 

Object *next; 

Object *referent; 


/* Pull the interesting fields out of the Reference object. 
oy 

next = dvmGetFieldObject (reference, offVmData) ; 

referent = dvmGetFieldObject (reference, offReferent) ; 


if (referent != NULL && !isMarked(ptr2chunk(referent), markContext)) { 
markObjectNonNull (referent, markContext) ; 
scanRequired = true; 


/* Let later GCs know not to reschedule this reference. 
cr] 
dvmSetFieldObject (reference, offVmData, 
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SCHEDULED REFERENCE MAGIC); 


reference - next; 


} 


HPROF CLEAR GC SCAN STATE(); 


if (scanRequired) { 
processMarkStack (markContext) ; 
} 


} 


if (workRequired) { 
dvmSignalHeapWorker (false) ; 
} 


} 


(5) 调用 函数 dvmHeapScheduleFinalizationsO 调 用 未 曾 标记 的 对 象 , 让 每 一 个 对 象 最 后 删除 
动作 可 以 运行 , 以 便 后 面 从 内 存 里 把 对 象 删除 ,相当 于 对 象 的 析 构 作用 。 函 数 dvmHeapScheduleFinalizations) 
的 实现 代码 如 下 。 

void dvmHeapScheduleFinalizations() 


{ 
HeapRefTable newPendingRefs; 
LargeHeapRefTable *finRefs = gDvm.gcHeap->finalizableRefs; 
Object **ref; 
Object **lastRef; 
size_t totalPendCount; 
GcMarkContext *markContext 


&gDvm.gcHeap->markContext ; 


/* 

* All reachable objects have been marked. 

* Any unmarked finalizable objects need to be finalized. 
* 


/* Create a table that the new pending refs will 

* be added to. 

sy 

if (!dvmHeapInitHeapRefTable (&newPendingRefs, 128)) { 
//TODO: mark all finalizable refs and hope that 
uy we can schedule them next time. Watch out, 
// because we may be expecting to free up space 
Jul by calling finalizers. 
LOGE GC("dvmHeapScheduleFinalizations(): no room for " 

"pending finalizations\n") ; 

dvmAbort () ; 


} 


/* Walk through finalizableRefs and move any unmarked references 
* to the list of new pending refs. 

e 

totalPendCount - 0; 
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while (finRefs !- NULL) { 
Object **gapRef; 
size t newPendCount - 0; 


gapRef - ref - finRefs-»refs.table; 

lastRef - finRefs-»refs.nextEntry; 

while (ref < lastRef) { 
DvmHeapChunk *hc; 


hc = ptr2chunk(*ref); 
if (!isMarked(hc, markContext)) { 
if (!dvmHeapAddToHeapRefTable (&newPendingRefs, *ref)) { 
//TODO: add the current table and allocate 
// a new, smaller one. 
LOGE GC("dvmHeapScheduleFinalizations(): " 
"no room for any more pending finalizations: %zd\n", 
dvmHeapNumHeapRefTableEntries (&newPendingRefs) ) ; 
dvmAbort () ; 
} 
newPendCount++; 
} else { 
/* This ref is marked, so will remain on finalizableRefs. 
=; 
if (newPendCount > 0) { 
/* Copy it up to fill the holes. 
al) 
*gapRef++ = *ref; 
} else { 
/* No holes yet; don't bother copying. 
eu 
gapRef++; 
} 
} 
ref++; 
} 
finRefs->refs.nextEntry = gapRef; 
//TODO: if the table is empty when we're done, free it. 
totalPendCount += newPendCount; 
finRefs = finRefs->next; 
} 
LOGD GC("dvmHeapScheduleFinalizations(): %zd finalizers triggered.\n", 
totalPendCount); 
if (totalPendCount == 0) { 
/* No objects required finalization. 
* Free the empty temporary table. 
E) 
dvmClearReferenceTable (&newPendingRefs) ; 
return; 


} 


/* Add the new pending refs to the main list. 
s 
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e- 


if (!dvmHeapAddTableToLargeTable (&gDvm.gcHeap-»pendingFinalizationRefs, 


&newPendingRefs)) 
{ 
LOGE_GC("dvmHeapScheduleFinalizations(): can't insert new " 
"pending finalizations\n") ; 
dvmAbort () ; 
} 


//TODO: try compacting the main list with a memcpy loop 


/* Mark the refs we just moved; we don't want them or their 
* children to get swept yet. 
*/ 
ref = newPendingRefs.table; 
lastRef - newPendingRefs.nextEntry; 
assert(ref « lastRef); 
HPROF SET GC SCAN STATE(HPROF ROOT FINALIZING, 0); 
while (ref < lastRef) { 
markObjectNonNull(*ref, markContext); 
refe; 


) 


HPROF CLEAR GC SCAN STATE(); 


/* Set markAllReferents so that we don't collect referents whose 
* only references are in final-reachable objects. 

* TODO: eventually provide normal reference behavior by properly 
* marking these references. 

E) 

gDvm.gcHeap-»markAllReferents - true; 

processMarkStack (markContext) ; 

gDvm.gcHeap-»markAllReferents - false; 


dvmSignalHeapWorker (false); 


} 
(6) 调用 函数 dvmHeapSweepUnmarkedObjectsO 清 除 未 曾 标记 的 对 象 , 也 就 是 删除 没有 再 使 
用 的 对 象 。 函 数 dvmHeapSweepUnmarkedObjects0 的 实现 代码 如 下 。 


dvmHeapSweepUnmarkedObjects(int *numFreed, size t *sizeFreed) 
{ 

const HeapBitmap *markBitmaps; 

const GcMarkContext *markContext; 

HeapBitmap objectBitmaps[HEAP SOURCE MAX HEAP COUNT]; 

size t origObjectsAllocated; 

size t origBytesAllocated; 

size t numBitmaps; 


/* All reachable objects have been marked. 

* Detach any unreachable interned strings before 
* we sweep. 

E 

dvmGcDetachDeadInternedStrings (isUnmarkedObject) ; 


«ap 


P= seep Ancroia nin 


/* Free any known objects that are not marked. 

oii 

origObjectsAllocated = dvmHeapSourceGet Value (HS OBJECTS ALLOCATED, NULL, 0); 
origBytesAllocated = dvmHeapSourceGetValue(HS BYTES ALLOCATED, NULL, 0); 


markContext &gDvm.gcHeap->markContext ; 
markBitmaps = markContext->bitmaps; 
numBitmaps = dvmHeapSourceGetObjectBitmaps (objectBitmaps, 
HEAP SOURCE MAX HEAP COUNT); 
#ifndef NDEBUG 
if (numBitmaps !- markContext-»numBitmaps) { 
LOGE ("heap bitmap count mismatch: $zd != %zd\n", 
numBitmaps, markContext->numBitmaps) ; 
dvmAbort () ; 


} 
C) 调用 函数 dvmHeapFinishMarkStep0， 对 已 经 删除 的 对 象 进行 内 存 回收 ， 可 以 调用 堆 管 
理 函 数 改变 目前 堆 使 用 的 内 存 ， 并 整理 内 存 ， 这 样 就 可 以 得 到 更 多 的 空闲 内 存 了 。 函 数 
dvmHeapFinishMarkStepO 的 实现 代码 如 下 。 


void dvmHeapFinishMarkStep () 


{ 


HeapBitmap *markBitmap; 
HeapBitmap objectBitmap; 
GcMarkContext *markContext; 


markContext = &gDvm.gcHeap->markContext ; 


/* The sweep step freed every object that appeared in the 

* HeapSource bitmaps that didn't appear in the mark bitmaps. 
* The new state of the HeapSource is exactly the final 

* mark bitmaps, so swap them in. 
* 
* 


The old bitmaps will be swapped into the context so that 
* we can clean them up. 
2 
dvmHeapSourceReplaceObjectBitmaps (markContext -»bitmaps, 
markContext-»numBitmaps); 
/* Clean up the old HeapSource bitmaps and anything else associated 
* with the marking process. 
+/ 
dvmHeapBitmapDeleteList (markContext->bitmaps, markContext->numBitmaps) ; 
destroyMarkStack (&markContext->stack) ; 
memset (markContext, 0, sizeof (*markContext) ) ; 


} 

上 述 算法 函数 的 整个 过 程 ， 就 是 Dalvik 虚拟 机 的 整个 标记 和 删除 的 算法 过 程 ， 实 际 的 代码 
会 相当 复杂 ， 算 法 上 是 很 清楚 的 ， 就 是 细节 、 时 间 方 面 要 求 相当 严格 ， 否 则 就 会 乱 删除 还 在 使 
用 的 对 象 ， 就 导致 整个 虚拟 机 的 运行 出 错 。 
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9.5.4 在 什么 时 候 进行 垃圾 回收 


IBA Dalvik 虚拟 机 是 什么 时 候 进行 垃圾 回收 呢 ? 要 回答 这 个 问题 ， 得 继续 分 析 代 码 ， 继 续 
进入 下 面 的 学 习 。 其 实 ， 垃 圾 回收 主要 有 两 种 方式 ， 一 种 是 虚拟 机 线程 自动 进行 的 ， 一 种 是 手 
动 进行 的 。 现 在 先 来 学 习 自动 进行 的 方式 ， 所 谓 自动 方式 ， 就 是 虚拟 机 创建 一 个 线程 ， 这 个 线 
程 定时 进行 。 虚 拟 机 在 初始 化 时 ， 就 进行 创建 这 个 线程 ， 例 如 下 面 的 代码 : 

if (gDvm. zygote) { 

if (!dvmInitZygote()) 

gotofail; 

) eise( 

if(!dvmInitAfterZygote()) 

gotofail; 

} 

在 上 述 代码 中 调用 了 函数 dvmInitAfterZygote0， 此 函数 中 会 调用 函数 dvmSignalCatcherStartup() 
来 创建 垃圾 回收 线程 。 函 数 dvmlInitAfterZygote() 的 实现 代码 如 下 。 

bool dvmInitAfterZygote (void) 


{ 


m 


u8 startHeap, startQuit, startJdwp; 
u8 endHeap, endQuit, endJdwp; 
startHeap = dvmGetRelativeTimeUsec(); 
/* 
* Post-zygote heap initialization, including starting 
* the HeapWorker thread. 
E 
if (!dvmGcStartupAfterZygote()) 

return false; 
endHeap - dvmGetRelativeTimeUsec(); 
startQuit = dvmGetRelativeTimeUsec(); 
/* start signal catcher thread that dumps stacks on SIGQUIT */ 
if (!gDvm.reduceSignals && !gDvm.noQuitHandler) { 

if (IdvmSignalCatcherStartup()) 

return false; 

} 


/* start stdout/stderr copier, if requested */ 
if (gDvm.logStdio) { 
if (!dvmStdioConverterStartup () ) 
return false; 
} 


endQuit = dvmGetRelativeTimeUsec(); 
startddwp = dvmGetRelativeTimeUsec() ; 
/* 
* Start JDWP thread. If the command-line debugger flags specified 
* "suspend-y", this will pause the VM. We probably want this to 
* come last. 
qu 
if (IdvmInitJDWP()) { 
LOGD("JDWP init failed; continuing anyway\n") ; 


} 


endJdwp = dvmGetRelativeTimeUsec () ; 


«ap 


LOGV("thread-start heap=%d quit=%d jdwp=%d total=%d usec\n", 
(int) (endHeap-startHeap), (int) (endQuit-startQuit), 
(int) (endJdwp-startJdwp), (int) (endJdwp-startHeap)); 
#ifdef WITH JIT 
if (gDvm.executionMode -- kExecutionModeJit) ( 
if (!dvmCompilerStartup()) 
return false; 


函数 dvmSignalCatcherStartup0 的 实现 代码 如 下 。 
bool dvmSignalCatcherStartup (void) 


gDvm.haltSignalCatcher- false; 
if(!dvmCreateInternalThread (&gDvm.signalCatcherHandle, 
"SignalCatcher", signalCatcherThreadStart , NULL) ) 
returnfalse; 

returntrue; 


} 


通过 上 面 的 这 段 代 码 ， 就 可 以 看 到 线程 运行 函数 是 signalCatcherThreadStart0， 在 这 个 函数 
里 就 会 调用 函数 dvmCollectGarbage0 来 进行 垃圾 回收 。 实 现代 码 如 下 。 


void dvmCollectGarbage (bool collectSoftReferences) 


dvmLockHeap () ; 

LOGVV ("ExplicitGCWn"); 

dvmCollectGarbageInternal (collectSoftReferences) ; 
dvmUnlockHeap () ; 


} 

此 函数 主要 通过 锁 来 锁 住 多 线程 访问 的 推 空间 相关 对 象 ， 然 后 直接 就 调用 函数 
dvmCollectGarbageInternal 来 进行 垃圾 回收 过 程 了 ， 也 就 调用 上 面 标记 删除 算法 的 函数 。 

另 一 种 方式 通过 调用 运行 库 的 GC 来 回收 ， 例 如 下 面 的 代码 。 


staticvoidDalvik java lang Runtime gc(constu4* args,JValue*pResult) 


{ 

UNUSED PARAMETER (args); 
dvmCollectGarbage (false); 
RETURN VOID(); 


此 处 也 是 调用 了 函数 dvmCollectGarbage0 来 进行 垃圾 回收 。 手 动 的 方式 适合 当 需 要 内 存 ， 
但 线程 又 没有 调用 时 进行 。 


9.5.5 ”调试 信息 


一 般 来 说 ，Java 虚拟 机 要 求 支 持 verbosegc 选项 ， 输 出 详细 的 垃圾 收集 调试 信息 。Dalvik 虚 
拟 机 却 可 以 接受 verbosege 选项 ， 然 后 什么 都 不 做 。Dalvik 虚拟 机 使 用 自己 的 一 套 日 志 机 制 来 输 
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出 调试 信息 。 

如 果 在 Linux 下 运行 adb logcat 命令 ， 会 看 到 如 下 的 输出 信息 。 

D/dalvikvm( 745): GC CONCURRENT freed 199K, 53% free 3023K/6343K,external 0K/0K, paused 

2ms«2ms 

(1) D/dalvikvm: 表示 由 Dalvik VM 输出 的 调试 信息 ， 括 号 后 的 数字 代表 Dalvik 虚拟 机 所 
在 进程 的 pid。GC_CONCURRENT 有 以 下 几 种 表示 触发 垃圾 收集 的 原因 。 

O GC MALLOC: 内 存 分 配 失败 时 触发 。 

口 GC CONCURRENT: 当 分 配 的 对 象 大 小 超过 384KB 时 触发 。 

O GC EXPLICIT: 对 垃圾 收集 的 显 式 调用 (System.gc)。 

O GC EXTERNAL ALLOC: 外 部 内 存 分 配 失败 时 触发 。 

(2) freed 199K: 表示 本 次 垃圾 收集 释放 了 199KB 的 内 存 。 

(3) 53% free 3023K/6343K: 其 中 6343K 表示 当前 内 存 总 量 ，3023K 表示 可 用 内 存 ，53% 表 
示 可 用 内 存 占 总 内 存 的 比例 。 

(4) external OK/OK: 表示 可 用 外 部 内 存 /外 部 内 存 总 量 。 

(5) paused 2ms+2ms: 第 一 个 时 间 值 表示 markrootset 的 时 间 , 第 二 个 时 间 值 表示 第 二 次 mark 
的 时 间 。 如 果 触 发 原因 不 是 GC_CONCURRENT， 这 一 行为 单个 时 间 值 ， 表 示 垃 圾 收集 的 耗 时 
时 间 。 

由 此 可 以 得 出 如 下 三 个 结论 。 

(1) 虽然 Dalvik 虚拟 机 提供 了 一 些 调 试 信息 , 但 是 还 缺乏 一 些 关键 信息 ,比如 说 mark 阶段 
和 sweep 阶段 的 时 间 ， 分 配 内 存 失败 时 是 因为 分 配 多 大 的 内 存 失败 ， 还 有 对 于 SoftReference、 
WeakReference 和 PhantomReference 的 处 理 ， 每 次 垃圾 收集 处 理 了 多 少 个 这 些 引 用 等 。 

(2) 目前 Dalvik 虚拟 机 的 所 有 线程 共享 一 个 内 存 堆 ， 这 样 在 分 配 内 存 时 必须 在 线程 之 间 互 
斥 ， 可 以 考虑 为 每 个 内 存 分 配 一 个 线程 局 部 存储 堆 ， 一 些小 的 内 存 分 配 可 以 直接 从 该 堆 中 分 配 
而 无 须 互 斥 锁 。 

(3) Dalvik 虚拟 机 中 引入 了 concurrentmark， 但 是 对 于 多 核 CPU， 可 以 实现 parelmark， 即 
可 以 使 用 多 个 线程 同时 运行 mark 阶段 。 

这 些 都 是 目前 Dalvik 虚拟 机 内 存 管理 可 以 做 出 的 改进 。 


9.6 Dalvik 虚拟 机 和 Java 虚拟 机 垃圾 收集 机 制 的 区 别 


Java 虚拟 机 是 一 个 规范 ， 或 者 符合 该 规范 的 实现 ， 或 者 这 样 的 实现 运行 的 实例 。Java 虚拟 
机 规范 中 并 没有 规定 要 使 用 各 种 垃圾 收集 机 制 ; 或 者 说 , Java 虚拟 机 规范 写 明 了 符合 规范 的 Java 
虚拟 机 实现 要 提供 自动 内 存 管理 的 功能 ， 但 并 不 一 定 要 有 某 种 特定 的 “垃圾 收集 ”。 

而 Dalvik 虚拟 机 是 一 个 具体 的 实现 。 于 是 笼统 地 问 “Java 虚拟 机 与 Dalvik 虚拟 机 的 垃圾 收 
集 有 何不 同 ” 是 不 合适 的 ， 对 比 的 两 者 不 在 同一 个 层次 上 。 即 便 是 在 同一 个 Java 虚拟 机 中 ， 一 
般 也 会 有 多 个 垃圾 收集 实现 。 例 如 Oracle 的 HotSpot 虚拟 机 中 根据 不 同 的 使 用 场景 而 实现 了 不 
同 算法 /不 同调 教 的 垃圾 收集 。 

Dalvik 虚拟 机 在 1.0 时 使 用 的 垃圾 收集 算法 是 没有 分 代 的 “标记 -清除 ”(Mark Sweep)， 对 
堆 上 数据 进行 准确 式 (exact/precise) 标 记 ， 对 栈 / 寄 存 器 上 数据 进行 保守 式 (conservative) 标 记 。 标 
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记 的 内 容 可 以 参考 下 面 的 注释 : 


// 下 面 的 源码 路 径 是 : dalvik/vm/alloc/MarkSweep.c 

/* Mark the set of root objects. 

* 

* Things we need to scan: 

* - System classes defined by root classloader 

* - For each thread: 

*  - Interpreted stack, from top to "curFrame" 

+ - Dalvik registers (args + local vars) 
* - UNI local references 
* - Automatic VM local references (TrackedAlloc) 
* - Associated Thread/VMThread object 
*  - ThreadGroups (could track & start with these instead of working 
* upward from Threads) 
*  - Exception currently being thrown, if present 
* - JNI global references 
* - Interned string table 
* - Primitive classes 
* - Special objects 

*  - gDvm.outOfMemoryObj 

* - Objects allocated with ALLOC NO GC 

* - Objects pending finalization (but not yet finalized) 
* - Objects in debugger object registry 

* 
* 
* 
* 


Don't need: 
- Native stack (for in-progress stuff in the VM) 
- The TrackedAlloc stuff watches all native VM references. 


许多 垃圾 收集 实现 都 是 在 对 象 开头 的 地 方 留 一 小 块 空间 给 垃圾 收集 标记 用 ， 而 Dalvik 虚拟 
机 则 不 同 ， 在 进行 垃圾 收集 时 会 单独 申请 一 块 空间 ， 以 位 图 的 形式 来 保存 整个 堆 上 的 对 象 的 标 
记 ， 在 垃圾 收集 结束 后 就 释放 该 空间 。 

在 标记 阶段 ， 从 根 集合 开始 ， 沿 着 对 象 用 的 引用 进行 标记 直到 没有 更 多 可 标记 的 对 象 为 止 。 
标记 结束 后 ， 被 标记 的 就 是 活着 的 对 象 ， 没 被 标记 到 的 就 是 “垃圾 ”。 在 清除 阶段 ，Dalvik 虚 
拟 机 并 不 直接 对 堆 做 什么 操作 ， 而 是 在 一 个 记录 分 配 状 况 的 位 图 上 把 被 认为 是 垃圾 的 对 象 所 在 
位 置 的 分 配 标记 清 零 。 为 了 不 让 这 个 位 图 太 大 ， 位 图 中 并 不 是 每 一 位 对 应 到 堆 上 的 一 个 字 节 ， 
而 是 对 应 到 一 块 固定 大 小 的 空间 。 为 此 ， 堆 空间 的 分 配 也 是 有 一 定 对 齐 的 。 

只 进行 “标记 -清除 ”工作 ， 在 经 过 多 次 垃圾 收集 后 可 能 会 使 堆 被 碎片 化 。Android 所 实现 
的 libc( 称 为 Bionic) 对 这 种 情况 有 特别 的 实现 ， 可 以 避免 碎片 化 这 一 问题 的 发 生 。 其 实 Dalvik 虚 
拟 机 的 根源 还 是 在 Java 虚拟 机 上 ， 只 要 能 符合 规范 正确 执行 Java 的 .class 文件 的 就 是 Java 虚拟 
机 。 那 么 Android 开发 包 中 的 dx 与 Dalvik 虚拟 机 结合 起 来 , 就 可 以 看 成 是 一 个 Java 虚拟 机 了 (要 
把 一 个 东西 称 为 “Java 虚拟 机 ”必须 要 通过 JCK(Java Compliance Kit) 的 测试 并 获得 授权 后 才能 
行 , 所 以 严格 来 说 “dx + Dalvik 虚拟 机 ”不 能 叫 作 Java 虚拟 机 , 因为 没 授权 )。 如 果 去 阅读 Dalvik 
虚拟 机 的 文档 ， 会 发 现 其 中 有 很 多 引用 到 Java 虚拟 机 规范 的 地 方 ， 而 且 整 体 设 计 都 考虑 到 了 与 
Java 虚拟 机 的 兼容 性 的 。 它 与 Java 虚拟 机 规范 的 规定 最 大 的 不 同 在 于 它 采 用 了 基于 寄存 器 的 指 
令 集 ， 而 Java 虚拟 机 采用 了 基于 栈 的 指令 集 。 这 可 以 看 作 是 专门 为 ARM 而 优化 的 设计 。Dalvik 
虚拟 机 要 省 内 存 和 省 电 ， 有 很 多 设计 都 是 围绕 这 两 个 目标 来 进行 的 。 
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线程 是 Dalvik 虚拟 机 处 理事 物 的 基础 ， 通 过 线程 可 以 管理 Android 中 的 内 存 分 配 情 况 。 在 
本 书 前 面 的 内 容 中 ， 已 经 讲解 过 线程 和 进程 的 基本 知识 。 本 章 将 详细 讲解 Dalvik 虚拟 机 线程 管 
理 的 基本 知识 ， 了 解 和 线程 有 关 的 源码 以 及 优化 知识 ， 为 读者 步 入 本 书后 面 知识 的 学 习 打 下 
基础 。 


10.4 Java 中 的 线程 机 制 


Android 中 的 线程 机 制 和 Java 中 的 线程 机 制 类 似 ， 本 节 将 简要 讲解 Java 线程 机 制 的 基本 知 
识 ， 为 读者 步 入 本 书后 面 知识 的 学 习 打 下 基础 。 


10.1.1 Java 的 多 线程 


线程 是 一 个 程序 内 部 的 顺序 控制 流 ， 一 个 进程 相当 于 一 个 任务 ， 一 个 线程 相当 于 一 个 任务 
中 的 一 条 执行 路 径 ; 多 进程 是 指 在 操作 系统 中 能 同时 运行 多 个 任务 (程序 ); 多 线程 在 同一 个 应 用 
程序 中 有 多 个 顺序 流 同时 执行 ，Java 的 线程 是 通过 java.lang.Thread 类 来 实现 的 ，Java 虚拟 机 启 
动 时 会 有 一 个 由 主 方法 (public static void main0f}) 所 定义 的 线程 ; 可 以 通过 创建 Thread 的 实例 来 
创建 新 的 线程 ; 每 个 线程 都 是 通过 某 个 特定 Thread 对 象 所 对 应 的 方法 run0 来 完成 其 操作 的 , 方 
法 run0 称 为 线程 体 ， 通 过 调用 Thread 类 的 start0 方 法 来 启动 一 个 线程 。 

PALS UC E 在 许多 情况 
机 同时 去 做 几 件 事情 ， TRARA TAA 
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Second，TPS) 是 最 重要 的 指标 之 一 ， 它 代表 着 一 秒 内 服务 器 端 平均 能 响应 的 请 求 总 数 ， 而 TPS 
值 与 程序 的 并 发 能 力 又 有 非常 密切 的 关系 。 对 于 计算 量 相同 的 任务 ， 程 序 线程 并 发 协调 得 越 有 
条 不 紊 ， 效 率 就 会 越 高 ， 反 之， 线程 之 间 频 繁 阻塞 甚至 死 锁 ， 将 会 大 大 降低 程序 的 并 发 能 力 。 

服务 器 端 是 Java 最 擅长 的 领域 之 一 ， 这 个 领域 的 应 用 占 了 Java 应 用 中 最 大 的 一 块 份额 。 不 
过 如 何 写 好 并 发 应 用 程序 却 是 程序 开发 的 难点 之 一 ， 处 理 好 并 发 方面 的 问题 通常 需要 更 多 的 经 
验 。 幸 好 Java 和 虚拟 机 提供 了 许多 工具 ， 把 并 发 编程 的 门槛 降低 了 不 少 。 另 外 ， 各 种 中 间 件 服 
务 器 、 各 类 框架 都 努力 地 替 程 序 员 处 理 尽 可 能 多 的 线程 并 发 细节 ， 使 程序 员 在 编码 时 能 更 关注 
业务 逻辑 ， 而 不 是 花费 大 部 分 时 间 去 关注 此 服务 会 同时 被 多 少 人 调用 。 但 是 无 论语 言 、 中 间 件 
和 框架 如 何 先进 ， 我 们 都 不 能 期 望 它们 能 独立 完成 并 发 处 理 的 所 有 事情 ， 了 解 并 发 的 内 幕 也 是 
成 为 一 个 高 级 程序 员 不 可 缺少 的 课程 。 

一 般 来 说 ， 我 们 把 正在 计算 机 中 执行 的 程序 叫 作 “进程 ”(Process)， 而 不 将 其 称 为 程序 
(Program)。 所 谓 “ 线 程 ”(Thread)， 是 “进程 ”中 某 个 单一 顺序 的 控制 流 。 新 兴 的 操作 系统 ， 如 
Mac、Windows NT、Windows 95 等 大 多 采用 多 线程 的 概念 ， 把 线程 视 为 基本 执行 单位 ， 线 程 也 
是 Java 中 的 相当 重要 的 组 成 部 分 之 一 。 

甚至 最 简单 的 Applet 也 是 由 多 个 线程 来 完成 的 。 在 Java 中 ， 任 何 一 个 Applet 的 paint() fl 
update0) 方 法 都 是 由 AWT(Abstract Window Toolkit) 绘 图 与 事件 处 理 线程 调用 的 ， 而 Applet 主要 
的 里 程 碑 方法 一 一 init0、start0、stop0 和 destory0 是 由 执行 该 Applet 的 应 用 调用 的 。 

单线 程 的 概念 没有 什么 新 的 地 方 ， 真 正 有 趣 的 是 在 一 个 程序 中 同时 使 用 多 个 线程 来 完成 不 
同 的 任务 。 某 些 地 方 用 轻 量 进程 (Lightweig ht Process) 来 代替 线程 ， 线 程 与 真正 进程 的 相似 性 在 
于 它们 都 是 单一 顺序 控制 流 。 然 而 线程 被 认为 轻 量 是 由 于 它 运 行 于 整个 程序 的 上 下 文 内 ， 能 使 
用 整个 程序 共有 的 资源 和 程序 环境 。 

作为 单一 顺序 控制 流 ， 在 运行 的 程序 内 线程 必须 拥有 一 些 资源 作为 必要 的 开销 。 例 如 必须 
有 执行 堆栈 和 程序 计数 器 在 线程 内 执行 的 代码 只 在 它 的 上 下 文中 起 作用 ， 因 此 某 些 地 方 用 “ 执 
行 上 下 文 ” 来 代替 “线程 ”。 


10.1.2 ”线程 的 实现 


并 发 不 一 定 要 依赖 多 线程 (如 PHP 中 很 常见 的 多 进程 并 发 )， 但 是 在 Java 里 面谈 论 并 发 ， 大 
多 数 都 与 线程 脱 不 开关 系 。 讲 到 Java 线程 ， 就 要 从 Java 线程 在 虚拟 机 中 的 实现 开始 讲 起 。 

我 们 知道 ， 线 程 是 比 进程 更 轻 量 级 的 调度 执行 单位 ， 线 程 的 引入 ， 可 以 把 一 个 进程 的 资源 
分 配 和 执行 调度 分 开 ， 各 个 线程 既 可 以 共享 进程 资源 (内 存 地 址 、 文 件 IO 等 )， 又 可 以 独立 调度 
(线程 是 CPU 调度 的 最 基本 单位 )。 主 流 的 操作 系统 都 提供 了 线程 实现 ，Java 则 提供 了 在 不 同 硬 
件 和 操作 系统 平台 下 对 线程 操作 的 统一 处 理 , 每 个 java.lang.Thread 类 的 实例 就 代表 了 一 个 线程 。 
不 过 Thread 类 与 大 部 分 的 Java API 有 着 显著 的 差别 ， 它 所 有 的 关键 方法 都 被 声明 为 Native。 

在 Java API 中 一 个 Native 方法 可 能 就 意味 着 这 个 方法 没有 使 用 或 无 法 使 用 平台 无 关 的 手段 
来 实现 (当然 也 可 能 是 为 了 执行 效率 而 使 用 Native 方法 , 不 过 通常 最 高 效率 的 手段 也 就 是 平台 相 
关 的 手段 )。 

实现 线程 主要 有 三 种 方式 : 使 用 内 核 线程 实现 ， 使 用 用 户 线程 实现 ， 使 用 用 户 线程 加 轻 量 
级 进程 混合 实现 。 


> 
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1. 使 用 内 核 线程 实现 


内 核 线 程 (Kernel Thread, KLT) 就 是 直接 由 操作 系统 内 核 (Kernel， 下 称 内 核 ) 支 持 的 线程 ,这 
种 线程 由 内 核 来 完成 线程 的 切换 。 内 核 通过 操纵 调度 器 (Scheduler) 对 线程 进行 调度 ， 并 负责 将 线 
程 的 任务 映射 到 各 个 处 理 器 上 。 每 个 内 核 线程 都 可 以 看 作 是 内 核 的 一 个 分 身 ， 这 样 操作 系统 就 
有 能 力 同时 处 理 多 件 事情 ， 支 持 多 线程 的 内 核 就 叫 多 线程 内 核 (Multi-Threads Kernel). 

程序 一 般 不 会 直接 去 使 用 内 核 线程 ， 而 是 去 使 用 内 核 线程 的 一 种 高 级 接口 一 一 轻 量 级 进程 
(Light Weight Process，LWP)， 轻 量 级 进程 就 是 我 们 通常 意义 上 所 讲 的 线程 ， 由 于 每 个 轻 量 级 进 
程 都 由 一 个 内 核 线程 支持 ， 因 此 只 有 先 支 持 内 核 线程 ， 才 能 有 轻 量 级 进程 。 这 种 轻 量 级 进程 与 
内 核 线程 之 间 1 : 1 的 关系 称 为 一 对 一 的 线程 模型 。 由 于 内 核 线程 的 支持 ， 每 个 轻 量 级 进程 都 成 
为 一 个 独立 的 调度 单元 ， 即 使 有 一 个 轻 量 级 进程 在 系统 调用 中 阻塞 了 ， 也 不 会 影响 整个 进程 继 
续 工作 ， 但 是 轻 量 级 进程 具有 它 的 局 限 性 : 首先 ， 由 于 是 基于 内 核 线程 实现 的 ， 所 以 各 种 线程 
操作 ， 如 创建 、 析 构 及 同步 ， 都 需要 进行 系统 调用 。 而 系统 调用 的 代价 相对 较 高 ， 需 要 在 用 户 
态 (User Mode) 和 内 核 态 区 emel Mode) 中 来 回 切换 。 其 次 ， 每 个 轻 量 级 进程 都 需要 有 一 个 内 核 线 
程 的 支持 , 因此 轻 量 级 进程 要 消耗 一 定 的 内 核资 源 ( 如 内 核 线程 的 栈 空间 ), 因此 一 个 系统 支持 轻 
量 级 进程 的 数量 是 有 限 的 。 


2. 使 用 用 户 线程 实现 


从 广义 上 来 讲 ， 一 个 线程 只 要 不 是 内 核 线程 ， 就 可 以 认为 是 用 户 线程 (User Thread，UT)， 
因此 从 这 个 意义 上 来 讲 轻 量 级 进程 也 属于 用 户 线程 ， 但 轻 量 级 进程 的 实现 始终 是 建立 在 内 核 之 
上 的 ， 许 多 操作 都 要 进行 系统 调用 ， 因 此 效率 会 受到 限制 。 

而 狭义 上 的 用 户 线程 指 的 是 完全 建立 在 用 户 空间 的 线程 库 上 ， 系 统 内 核 不 能 感知 到 线程 存 
在 的 实现 。 用 户 线程 的 建立 、 同 步 、 销 毁 和 调度 完全 在 用 户 态 中 完成 ， 不 需要 内 核 的 帮助 。 如 
果 程 序 实 现 得 当 ， 这 种 线程 不 需要 切换 到 内 核 态 ， 因 此 操作 可 以 是 非常 快速 且 低 消耗 的 ， 也 可 
以 支持 规模 更 大 的 线程 数量 ， 部 分 高 性 能 数据 库 中 的 多 线程 就 是 由 用 户 线 程 实现 的 。 这 种 进程 
与 用 户 线程 之 间 1 : N 的 关系 称 为 一 对 多 的 线程 模型 。 

使 用 用 户 线程 的 优势 在 于 不 需要 系统 内 核 支援 ， 劣 势 也 在 于 没有 系统 内 核 的 支援 ， 所 有 的 
线程 操作 都 需要 用 户 程序 自己 处 理 。 线 程 的 创建 、 切 换 和 调度 都 是 需要 考虑 问题 ， 而 且 由 于 操 
作 系 统 只 把 处 理 器 资源 分 配 到 进程 ， 那 诸如 “阻塞 如 何 处 理 ”、“ 多 处 理 器 系统 中 如 何 将 线程 
喘 射 到 其 他 处 理 器 上 ”这 类 问题 解决 起 来 将 会 异常 困难 ， 甚 至 不 可 能 完成 。 因 而 使 用 用 户 线程 
实现 的 程序 一 般 都 比较 复杂 ， 除 了 以 前 在 不 支持 多 线程 的 操作 系统 中 (如 DOS) 的 多 线程 程序 与 
少数 有 特殊 需求 的 程序 外 ， 现 在 使 用 用 户 线程 的 程序 越 来 越 少 了 ，Java、Ruby 等 语言 都 曾经 使 
用 过 用 户 线程 ， 最 终 又 都 放弃 了 使 用 它 。 


3. 混合 实现 


线程 除了 依赖 内 核 线程 实现 和 完全 由 用 户 程序 自己 实现 外 ， 还 有 一 种 将 内 核 线程 与 用 户 线 
程 一 起 使 用 的 实现 方式 。 在 这 种 混合 实现 下 ， 既 存在 用 户 线程 ， 也 存在 轻 量 级 进程 。 用 户 线 程 
还 是 完全 建立 在 用 户 空间 中 ， 因 此 用 户 线程 的 创建 、 切 换 、 析 构 等 操作 依然 廉价 ， 并 且 可 以 支 
持 大 规模 的 用 户 线程 并 发 。 而 操作 系统 提供 支持 的 轻 量 级 进程 则 作为 用 户 线程 和 内 核 线程 之 间 
的 桥梁 ， 这 样 可 以 使 用 内 核 提供 的 线程 调度 功能 及 处 理 器 映射 ， 并 且 用 户 线程 的 系统 调用 要 通 
过 轻 量 级 线程 来 完成 ， 大 大 降低 了 进程 被 阻塞 的 风险 。 在 这 种 混合 模式 中 ， 用 户 线 程 与 轻 量 级 
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进程 的 数量 比 是 不 定 的 ， 是 M : N 的 关系 ， 这 种 就 是 多 对 多 的 线程 模型 。 许 多 Unix 系列 的 操作 
系统 ， 如 Solaris, HP-UX 等 都 提供 了 M : N 的 线程 模型 实现 。 


4. Java 线程 的 实现 


Java 线程 在 JDK L2 之 前 ， 是 基于 名 为 “绿色 线程 ”(Green Threads) 的 用 户 线程 实现 的 ， 而 
在 JDK 12 中 ， 线 程 模型 被 蔡 换 为 基于 操作 系统 原生 线程 模型 来 实现 。 因 此 在 目前 的 IDK 版 本 
中 ， 操 作 系统 支持 怎样 的 线程 模型 ， 在 很 大 程度 上 就 决定 了 Java 虚拟 机 的 线程 是 怎样 映射 的 ， 
这 一 点 在 不 同 的 平台 上 没有 办 法 达成 一 致 ， 虚 拟 机 规范 中 也 并 未 限定 Java 线程 需要 使 用 哪 种 线 
程 模型 来 实现 。 线 程 模型 只 对 线程 的 并 发 规模 和 操作 成 本 产生 影响 ， 对 Java 程序 的 编码 和 运行 
过 程 来 说 ， 这 些 差异 都 是 透明 的 。 

对 于 Sun JDK 来 说 ， 它 的 Windows 版 与 Linux 版 都 是 使 用 一 对 一 的 线程 模型 来 实现 的 ， 一 
条 Java 线程 就 映射 到 一 条 轻 量 级 进程 中 ,因为 Windows 和 Linux 系统 提供 的 线程 模型 就 是 一 对 
一 的 。 

而 在 Solaris 平台 中 ， 由 于 操作 系统 的 线程 特性 可 以 同时 支持 一 对 一 (通过 Bound Threads 或 
Alternate Libthread 实现 ) 及 多 对 多 (通过 LWP/Thread Based Synchronization 实现 ) 的 线程 模型 ， 因 
此 在 Solaris 版 的 JDK 中 也 对 应 提供 了 两 个 平台 专 有 的 虚拟 机 参数 : -XX:+UseLWPSynchronization( 默 
认 值 ) 和 -XX:+UseBoundThreads 来 明确 指定 虚拟 机 使 用 的 是 哪 种 线程 模型 。 


10.1.3 ”线程 调度 


计算 机 通常 只 有 一 个 CPU, 在 任意 时 刻 只 能 执行 一 条 机 器 指令 , 每 个 线程 只 有 获得 CPU 的 
使 用 权 才能 执行 指令 。 在 任何 时 刻 ， 只 有 一 个 线程 占用 CPU， 处 于 运行 状态 。 

所 谓 多 线程 的 并 发 运行 , 其 实 是 指 各 个 线程 轮流 获得 CPU 的 使 用 权 , 分 别 执行 各 自 的 任务 。 
在 可 运行 池 中 ， 会 有 多 个 处 于 就 绪 状 态 的 线程 在 等 待 CPU。Java 虚拟 机 的 一 项 任务 就 是 负责 线 
程 的 调度 。 线 程 的 调度 是 指 按照 特定 的 机 制 为 多 个 线程 分 配 CPU 的 使 用 权 ， 有 如 下 两 种 调度 
模型 。 

ü “分 时 调度 模型 。 

ü 抢占 式 调度 模型 。 

分 时 调度 模型 是 指 让 所 有 线程 轮流 获得 CPU 的 使 用 权 ， 并 且 平 均 分 配 每 个 线程 占用 CPU 
的 时 间 片 。Java 虚拟 机 采用 抢占 式 调度 模型 ， 即 优先 让 可 运行 池 中 优先 级 高 的 线程 占用 CPU, 
如 果 可 运行 池 中 线程 的 优先 级 相同 ， 那 么 就 随机 地 选择 一 个 线程 ， 使 其 占用 CPU。 处 于 运行 状 
态 的 线程 会 一 直 运行 ， 直 至 它 不 得 不 放弃 CPU。 一 个 线程 会 因为 以 下 原因 而 放弃 CPU. 

O Java 虚拟 机 让 当前 线程 暂时 放弃 CPU， 转 到 就 绪 状 态 ， 使 其 他 线程 获得 运行 机 会 。 

ü ”当前 线程 因为 某 些 原因 而 进入 阻塞 状态 。 

O ”线程 运行 结束 。 

值得 注意 的 是 , 线程 的 调度 不 是 跨 平台 的 , 它 不 仅 取决 于 Java 虚拟 机 ， 还 取决 于 操作 系统 。 
在 某 些 操作 系统 中 ， 只 要 运行 中 的 线程 没有 遇 到 阻塞 ， 就 不 会 放弃 CPU: 在 某 些 操作 系统 中 
即使 运行 中 的 线程 没有 遇 到 阻塞 ， 也 会 在 运行 一 段 时 间 后 放弃 CPU， 给 其 他 线程 运行 的 机 会 。 

由 于 Java 线程 的 调度 不 是 分 时 的 ， 因 此 同时 启动 多 个 线程 后 ， 不 能 保证 各 个 线程 轮流 获得 
均等 的 CPU 时 间 片 。 如 果 程 序 希望 干预 Java 虚拟 机 对 线程 的 调度 过 程 ， 从 而 明确 地 让 一 个 线程 


Q» 
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给 另外 一 个 线程 运行 的 机 会 ， 可 以 采取 以 下 办 法 之 一 。 
(1) 调整 各 个 线程 的 优先 级 。 
(2) 让 处 于 运行 状态 的 线程 调用 Thread.sleep0 方 法 。 
G) 让 处 于 运行 状态 的 线程 调用 Thread.yield0 方 法 。 
(4) 让 处 于 运行 状态 的 线程 调用 另 一 个 线程 的 join0 方 法 。 


10.1.4 ”线程 状态 间 的 转换 


线程 的 状态 转换 是 线程 控制 的 基础 。 线 程 状态 总 的 可 分 为 五 大 状态 : 分 别 是 生 、 死 、 可 运 
行 、 运 行 、 等 待 /阻塞 。 具体 过 程 如 图 10-1 所 示 。 


等 待 /阻塞 /睡眠 


10-1 线程 的 状态 转换 


(1) 新 状态 : 线程 对 象 已 经 创建 ， 还 没有 在 其 上 调用 start0 方 法 。 

(2) 可 运行 状态 : 当 线 程 有 资格 运行 ， 但 调度 程序 还 没有 把 它 选 定 为 运行 线程 时 线程 所 处 
的 状态 。 当 start( 方 法 调用 时 ， 线 程 首先 进入 可 运行 状态 。 在 线程 运行 后 或 者 从 阻塞 、 等 待 或 睡 
眠 状态 回来 后 ， 也 返回 到 可 运行 状态 。 

(3) 运行 状态 : 线程 调度 程序 从 可 运行 池 中 选择 一 个 线程 作为 当前 线程 时 线程 所 处 的 状态 。 
这 也 是 线程 进入 运行 状态 的 唯一 一 种 方式 。 

(4) 等 待 /阻塞 /睡眠 状态 : 这 是 线程 有 资格 运行 时 它 所 处 的 状态 。 实 际 上 这 个 三 状态 组 合 为 
一 种 ， 其 共同 点 是 : 线程 仍旧 是 活 的 ， 但 是 当前 没有 条 件 运 行 。 换 句 话说 ， 它 是 可 运行 的 ， 但 
是 如 果 某 件 事件 出 现 ， 他 可 能 返回 到 可 运行 状态 。 

(5) 死亡 态 : 当 线程 的 run0 方 法 完成 时 就 认为 它 死去 。 这 个 线程 对 象 也 许 是 活 的 ， 但 是 ， 
它 已 经 不 是 一 个 单独 执行 的 线程 。 线 程 一 旦 死亡 ， 就 不 能 复生 。 如 果 在 一 个 死去 的 线程 上 调用 
stat;iX, Zh java.lang.IllegalThreadStateException 异常 。 

对 于 线程 阻止 需要 考虑 以 下 三 个 方面 ， 不 考虑 IO 阻塞 的 情况 : 

Q 睡眠 ; 

口 Sf: 

口 ” 因 为 需要 一 个 对 象 的 锁定 而 被 阻塞 。 

(D) 睡眠 

Thread.sleep(long millis) 和 Thread.sleep(long millis, int nanos) 静 态 方法 强制 当前 正在 执行 的 
线程 休眠 (暂停 执行 )， 以 “ 减 慢 线 程 ”。 当 线程 睡眠 时 ， 它 入 睡 在 某 个 地 方 ， 在 苏醒 前 不 会 返回 
到 可 运行 状态 。 当 睡眠 时 间 到 期 ， 则 返回 可 运行 状态 。 


< 图 


CO ”线程 睡眠 的 原因 。 线 程 执 行 太 快 ， 或 者 需要 强制 进入 下 一 轮 ， 因 为 Java 虚拟 机 规范 不 
保证 合理 的 轮换 。 例 如 下 面 是 睡眠 的 实现 的 代码 ， 在 此 调用 了 静态 方法 。 


try { 
Thread .sleep (123) ; 

} catch (InterruptedException e) { 
e.printStackTrace(); 


} 


© ”睡眠 的 位 置 。 为 了 让 其 他 线程 有 机 会 执行 , 可 以 将 Thread.sleepO 的 调用 放 线 程 run0 内 。 
这 样 才能 保证 该 线程 执行 过 程 中 会 睡眠 。 例 如 ， 在 前 面 的 例子 中 ， 将 一 个 耗 时 的 操作 改 为 睡眠 ， 
以 减 慢 线程 的 执行 。 代 码 如 下 。 


public void run() { 
for(int i = 0;i<5;i++){ 
// 很 耗 时 的 操作 ， 用 来 减 慢 线程 的 执行 
ui for(long k= 0; k <100000000;k++) ; 
try { 
Thread.sleep (3) ; 
} catch (InterruptedException e) { 
e.printStackTrace () ; 


System.out.println(this.getName()«" :"+i); 


Process finished with exit code 0 
这 样 ， 线 程 在 每 次 执行 过 程 中 ， 总 会 睡眠 3ms， 睡 眼 了 ， 其 他 的 线程 就 有 机 会 执行 了 。 


注意 : 口 ” 线 程 睡眠 是 帮助 所 有 线程 获得 运行 机 会 的 最 好 方法 。 
O 线程 睡眠 到 期 自动 苏醒 ， 并 返回 到 可 运行 状态 ,不 是 运行 状态 。sleep0 〇 中 指定 的 时 间 
是 线程 不 会 运行 的 最 短 时 间 。 因 此 ，sleep0 方 法 不 能 保证 该 线程 睡眠 到 期 后 就 开始 执行 。 
O sleep0 是 静态 方法 ， 只 能 控制 当前 正在 运行 的 线程 。 


下 面 是 一 个 例子 。 


** 


+ 一 个 计数 器 ， 计 数 到 100， 在 每 个 数字 之 间 暂 停 1 秒 ， 每 隔 10 个 数字 输出 一 个 字符 串 
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public class MyThread extends Thread { 


public void run() { 
for (int i = 0; i < 100; i++) { 

if ((i) % 10 == 0) { 
System. out .println("------- "4 i); 

} 

System.out .print (i); 

try { 
Thread.sleep (1) ; 
System.out.print(" ”线程 睡眠 1 毫秒 ! \n") ; 

) catch (InterruptedException e) { 
e.printStackTrace(); 

} 


} 
} 


public static void main(String[] args) { 
new MyThread().start(); 


) 
} 
运行 结果 如 下 。 
------- 0 
0 REER 1 毫秒 ! 
i 线程 睡眠 1 毫秒 ! 
2 线程 睡眠 1 毫秒 ! 
3 线程 睡眠 1 毫秒 ! 
4 线程 睡眠 1 毫秒 ! 
5 线程 睡眠 1 毫秒 ! 
6 REER 1 毫秒 ! 
7 线程 睡眠 1 毫秒 ! 
8 REER 1 毫秒 ! 
9 线程 睡眠 1 毫秒 ! 
------- 10 
------- 90 
90 线程 睡眠 1 毫秒 ! 
91 线程 睡眠 1 毫秒 ! 
92 线程 睡眠 1 毫秒 ! 
93 线程 睡眠 1 毫秒 ! 
94 ARER 毫秒 ! 
95 线程 睡眠 1 毫秒 ! 
96 REER 毫秒 ! 


97 线程 睡眠 1 毫秒 ! 
98 HAERE! 
99 RERI 毫秒 ! 


Process finished with exit code 0 
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(2) 线程 的 优先 级 和 线程 让 步 yield0 

线程 的 让 步 是 通过 Thread .yield0 来 实现 的 。yield(0 方 法 的 作用 是 : 暂停 当前 正在 执行 的 线程 
对 象 ， 并 执行 其 他 线程 。 要 理解 yield0， 必 须 了 解 线程 的 优先 级 的 概念 。 线 程 总 是 存在 优先 级 ， 
优先 级 范围 为 1 一 10。Java 虚拟 机 线程 调度 程序 是 基于 优先 级 的 抢先 调度 机 制 。 在 大 多 数 情况 下 ， 
当前 运行 的 线程 优先 级 将 大 于 或 等 于 线程 池 中 任何 线程 的 优先 级 。 但 这 仅仅 是 大 多 数 情况 。 

当 设 计 多 线程 应 用 程序 的 时 候 ， 一 定 不 要 依赖 于 线程 的 优先 级 。 因 为 线程 调度 优先 级 操作 
是 没有 保障 的 ， 只 能 把 线程 优先 级 作用 作为 一 种 提高 程序 效率 的 方法 ， 但 是 要 保证 程序 不 依赖 
这 种 操作 。 

当 线 程 池 中 线程 都 具有 相同 的 优先 级 , 调度 程序 的 Java 虚拟 机 实现 自由 选择 它 喜 欢 的 线程 。 
这 时 候 调 度 程 序 的 操作 有 两 种 可 能 : 一 是 选择 一 个 线程 运行 ， 直 到 它 阻塞 或 者 运行 完成 为 止 。 
二 是 时 间 分 片 ， 为 池内 的 每 个 线程 提供 均等 的 运行 机 会 。 

设置 线程 的 优先 级 : 线程 默认 的 优先 级 是 创建 它 的 执行 线程 的 优先 级 。 可 以 通过 
setPriority(int newPriority) 更 改线 程 的 优先 级 。 代 码 如 下 。 

Thread t = new MyThread(); 
t.setPriority(8); 
t.start() ; 

线程 优先 级 为 1~10 之 间 的 正 整数 ，Java 虚拟 机 从 不 会 改变 一 个 线程 的 优先 级 。 然 而 ，1~10 
之 间 的 值 是 没有 保证 的 。 一 些 Java 虚拟 机 可 能 不 能 识别 10 个 不 同 的 值 , 而 将 这 些 优先 级 进行 每 
两 个 或 多 个 合并 ， 变 成 少 于 10 个 的 优先 级 ， 则 两 个 或 多 个 优先 级 的 线程 可 能 被 映射 为 一 个 优 
先 级 。 

线程 默认 优先 级 是 5，Thread 类 中 有 三 个 常量 定义 线程 的 优先 级 范围 。 

Q static int MAX. PRIORITY: 线程 可 以 具有 的 最 高 优先 级 。 

Q static int MIN PRIORITY: 线程 可 以 具有 的 最 低 优先 级 。 

Q static int NORM PRIORITY: 分 配给 线程 的 默认 优先 级 。 

(3) Thread.yield0 方 法 

Thread.yield0 方 法 作用 是 : 暂停 当前 正在 执行 的 线程 对 象 ， 并 执行 其 他 线程 。yield0 应 该 做 
的 是 让 当前 运行 线程 回 到 可 运行 状态 ， 以 允许 具有 相同 优先 级 的 其 他 线程 获得 运行 机 会 。 因 此 ， 
使 用 yield0 的 目的 是 让 相同 优先 级 的 线程 之 间 能 适当 的 轮转 执行 。 但 是 , 实际 中 无 法 保证 yield0 
达到 让 步 目 的 ， 因 为 让 步 的 线程 还 有 可 能 被 线程 调度 程序 再 次 选中 。 

由 此 可 见 ，yield0 从 未 导致 线程 转 到 等 待 /睡眠 /阻塞 状态 。 在 大 多 数 情 况 下 ，yield0 将 导致 
线程 从 运行 状态 转 到 可 运行 状态 ， 但 有 可 能 没有 效果 。 

(4) join0 方 法 

Thread 的 非 静 态 方法 join0 让 一 个 线程 B“ 加 入 ”到 另外 一 个 线程 A 的 尾部 。 在 A 执行 完 
毕 之 前 ，B 不 能 工作 。 代 码 如 下 。 

Thread t = new MyThread(); 
t.start(); 
t.join(); 

另外 ，join0 方 法 还 有 带 超时 限制 的 重 载 版 本 。 例 如 “tjoin(5000);” 的 意思 是 让 线程 等 待 
5000ms， 如 果 超 过 这 个 时 间 则 停止 等 待 ， 变 为 可 运行 状态 。 线程 的 加 入 join0 对 线程 栈 导 致 的 结 
果 是 线程 栈 发 生 了 变化 ， 当 然 这 些 变 化 都 是 瞬时 的 。 
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10.1.5 ”线程 安全 


线程 安全 是 指 当 多 个 线程 操作 同一 个 数据 段 时 ， 利 用 相应 的 互 斥 机 制 ， 避 免 数 据 段 中 的 数 
据 错 误 。 每 个 线程 尽量 只 访问 别 的 线程 不 访问 的 变量 或 内 存 ， 如 果 硬 是 要 访问 同一 变量 或 内 存 
的 话 ， 就 要 采用 适当 的 互 斥 机 制 来 避免 由 于 线程 切换 而 导致 的 不 确定 性 。“ 线 程 安全 函数 ”就 
是 在 多 线程 程序 中 调用 该 函数 ， 该 函数 本 身 不 会 出 错 ， 并 且 能 得 到 正确 的 结果 或 处 理 。 

我 们 已 经 有 了 线程 安全 的 一 个 抽象 定义 ， 那 接 下 来 我 们 就 讨论 一 下 在 Java 中 ， 线 程 安全 是 
如 何 具体 体现 的 ? 有 哪些 操作 是 线程 安全 的 ? 我 们 这 里 讨论 的 线程 安全 ， 只 限定 于 多 个 线程 之 
间 存 在 共享 数据 访问 这 个 前 提 ， 因 为 如 果 一 段 代 码 根本 不 会 与 其 他 线程 共享 数据 ， 那 么 从 线程 
安全 的 角度 上 看 ， 程 序 是 串 行 执行 还 是 多 线程 执行 对 它 来 说 是 完全 没有 区 别 的 。 

为 了 更 深入 地 理解 线程 安全 ， 在 这 里 我 们 可 以 不 把 线程 安全 当 作 一 个 非 真 即 假 的 二 元 排他 
选项 来 看 待 ， 按 照 线 程 安全 的 “安全 程度 ”由 强 至 弱 来 排序 ， 可 以 将 Java 中 各 种 操作 共享 的 数 
据 分 为 五 类 : 不 可 变 、 绝 对 线程 安全 、 相 对 线程 安全 、 线 程 兼容 和 线程 对 立 。 


1. 不 可 变 


在 Java 里 ( 特 指 JDK L5 以 后 ， 即 Java 内 存 模型 被 修正 之 后 的 Java)， 不 可 变 (Immutable) 的 
对 象 一 定 是 线程 安全 的 ， 无 论 是 对 象 的 方法 实现 还 是 方法 的 调用 ， 都 不 需要 再 进行 任何 的 线程 
安全 保障 措施 ， 在 上 一 章 里 我 们 谈 到 过 final 关键 字 带 来 的 可 见 性 时 曾经 提 到 过 这 一 点 ， 只 要 一 
个 不 可 变 的 对 象 被 正确 地 构建 出 来 (没有 发 生 this 引用 逃逸 的 情况 ), 那 其 外 部 的 可 见 状态 就 永远 
也 不 会 改变 ， 永 远 也 不 会 看 到 它 在 多 个 线程 之 中 处 于 不 一 致 的 状态 。“ 不 可 变 ” 带 来 的 安全 性 
是 最 简单 最 纯粹 的 。 

Java 中 ， 如 果 共 享 数据 是 一 个 基本 数据 类 型 ， 那 么 只 要 在 定义 时 使 用 final 关键 字 修 饰 它 就 
可 以 保证 它 是 不 可 变 的 。 如 果 共 享 数据 是 一 个 对 象 ， 那 就 需要 保证 对 象 的 行为 不 会 对 其 状态 产 
生 任 何 影响 才 行 ， 如 果 读 者 还 没 想 明 白 这 句 话 ， 不 妨 想 一 想 java.lang.String 类 的 对 象 ， 它 是 一 
个 典型 的 不 可 变 对 象 , 调用 它 的 substringO replace()fll concat0 这 些 方 法 都 不 会 影响 它 原来 的 值 ， 
只 会 返回 一 个 新 构造 的 字符 串 对 象 。 

保证 对 象 行为 不 影响 自己 状态 的 途径 有 很 多 种 ， 其 中 最 简单 的 就 是 把 对 象 中 带 有 状态 的 变 
量 都 声明 为 final， 这 样 在 构造 函数 结束 之 后 ， 它 就 是 不 可 变 的 ， 例 如 下 面 演示 代码 中 
java.lang Integer 构造 函数 所 示 的 ， 它 通过 将 内 部 状态 变量 value 定义 为 final 来 确保 状态 不 变 。 

private final int value; 
public Integer(int value) ( 
this.value-value; 

) 

在 Java API 中 符合 不 可 变 要 求 的 类 型 ， 除 了 上 面 提 到 的 String 外 ， 常 用 的 还 有 枚 举 类 型 ， 
以 及 javalang.Number 的 部 分 子 类 ,如 Long 和 Double 等 数值 包装 类 型 ,BigInteger 和 BigDecimal 
等 大 数据 类 型 。 但 同 为 Number 的 子 类 型 的 原子 类 Atomiclnteger 和 AtomicLong 则 并 非 不 可 变 的 。 
读者 不 妨 看 看 这 两 个 原子 类 的 源码 ， 想 一 想 为 什么 。 


2. 绝对 线程 安全 
绝对 线程 安全 完全 满足 Brian Goetz 给 出 的 对 线程 安全 的 定义 ， 这 个 定义 其 实 是 很 严格 的 ， 
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一 个 类 要 达到 “不 管 运行 时 环境 如 何 ， 调 用 者 都 不 需要 任何 额外 的 同步 措施 ”通常 需要 付出 很 
大 的 ， 甚 至 是 不 切实 际 的 代价 。 在 Java API 中 标注 自己 是 线程 安全 的 类 ， 大 多 数 都 不 是 绝对 线 
程 安全 。 我 们 可 以 通过 Java API 中 一 个 不 是 “绝对 线程 安全 ”的 线程 安全 类 来 看 看 这 里 的 “ 绝 
二 ”是 什么 意思 。 

如 果 说 java.util. Vector 是 一 个 线程 安全 的 容器 , 相信 所 有 的 Java 程序 员 对 此 都 不 会 有 异议 ， 
因为 它 的 aad0、getO0 和 size0 这 类 方法 都 是 被 synchronized 修饰 的 ， 尽 管 这 样 做 的 效率 很 低 ， 但 
确实 是 安全 的 。 但 是 ， 即 使 它 所 有 的 方法 都 被 修饰 成 同步 ， 也 不 意味 着 调用 它 的 时 候 永远 都 不 
再 需要 同步 手段 了 ， 请 看 看 下 面 演示 代码 中 的 测试 代码 可 以 测试 Vector 线程 安全 。 


private static Vector<Integer> Vector=new Vector<Integer>() j 
public static void main(String[] args) { 

while (true) f 

for (int i-o; i«10; i++) { 

vector.add (i); 

) 

Thread removeThread-new Thread(new Runnable() ( 
GOverride 

public void run() { 

for (inti=o;i(vector.size(); i++) { 
vector.remove (i); 


} 

) 

Thread printThread-new Thread(new Runnable() ( 
GOverride 

public void run() { 

for (int i-o; i(vector.size(); i++) { 
system.out .println( (vector.get (i))); 
) 

} 

) 

removeThread.start(); 

printThread. start(); 

// 不 要 同时 产生 过 多 的 线程 ， 否 则 会 导致 操作 系统 假死 
while (Thread.activeCount() >20); 

} 

} 


运行 结果 如 下 。 
Exception in thread "Thread-172" 
java .lang .ArrayIndexOutOfBoundsException: 
Array index out of range: 17 
at java .util.Vector.remove (Vector.java: 777) 
at org. fenixsoft .mulithread. VectorTest$l. run( VectorTest.java: 21) 
at java .lang. Thread. run (Thread.java: 662) 
很 明显 ， 尽 管 这 里 使 用 到 的 Vector 的 get). remove0 和 size() 方 法 都 是 同步 的 ， 但 是 在 多 线 
程 的 环境 中 ， 如 果 不 在 方法 调用 端 做 额外 的 同步 措施 ， 使 用 这 段 代 码 仍然 是 不 安全 的 ， 因 为 如 
果 另 一 个 线程 恰好 在 错误 的 时 间 里 删除 了 一 个 元 素 ， 导致 序号 i 已 经 不 再 可 用 的 话 ，get0 方 法 就 
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会 抛 出 一 个 ArrayIndexOutOfBoundsException。 如 果 要 保证 这 段 代码 能 正确 地 执行 下 去 ， 我 们 不 
得 不 把 removeThread 和 printThread 的 定义 改 成 如 下 的 代码 。 

Thread removeThread-new Thread (new Runnable() 4 

@Override 

public void run() { 

synchronized (vector) { 

for (inti-o; i'vector.size(); i++) { 

vector.remove (i); 


} 

) 

hi 

Thread printThread=new Thread(new Runnable() { 
GOverride 

public void run() { 

synchronized (vector) ( 

for (int i-oj i«vector.size(); i++) { 
System.out .println( (vector.get (i))); 
) 

} 

} 

}; 


在 上 述 代码 中 ， 必 须 加 入 同步 才能 保证 Vector 访问 的 线程 安全 性 。 

3. 相对 线程 安全 

相对 线程 安全 就 是 通常 意义 上 所 讲 的 线程 安全 ， 它 需要 保证 对 这 个 对 象 单独 的 操作 是 线程 
安全 的 ， 我 们 在 调用 的 时 候 不 需要 做 额外 的 保障 措施 ， 但 是 对 于 一 些 特定 顺序 的 连续 调用 ， 就 
可 能 需要 在 调用 端 使 用 额外 的 同步 手段 来 保证 调用 的 正确 性 。 上 面 的 两 段 演示 代码 就 是 相对 线 
程 安全 的 一 个 很 明显 的 案例 。 

在 Java 中 ， 大 部 分 的 线程 安全 类 都 属于 这 种 类 型 ， 例 如 Vector、HashTable、Collections 的 
synchronizedCollection() 方 法 包装 的 集合 等 。 

4. 线程 兼容 

线程 兼容 是 指 对 象 本 身 并 不 是 线程 安全 的 ， 但 是 可 以 通过 在 调用 端正 确 地 使 用 同步 手段 来 
保证 对 象 在 并 发 环境 中 安全 地 使 用 ， 我 们 平常 说 一 个 类 不 是 线程 安全 的 ， 绝 大 多 数 指 的 都 是 这 
种 情况 。Java API 中 大 部 分 的 类 都 是 线程 兼容 的 ， 如 与 前 面 的 Vector 和 HashTable 相对 应 的 集 
合 类 ArrayList 和 HashMap 等 。 


5. 线程 对 立 

线程 对 立 是 指 不 管 调用 端 是 否 采取 了 同步 措施 ， 都 无 法 在 多 线程 环境 中 并 发 使 用 的 代码 。 
由 于 Java 天 生 就 具备 多 线程 特性 ， 线 程 对 立 这 种 排斥 多 线程 的 代码 是 很 少 出 现 的 ， 而 且 通 常 都 
是 有 害 的 ， 应 当 尽 量 避 免 。 

一 个 线程 对 立 的 例子 是 Thread 类 的 suspend0 和 resume() 方 法 ， 如 果 有 两 个 线程 同时 持 有 一 
个 线程 对 象 ， 一 个 尝试 去 中 断 线程 ， 另 一 个 尝试 去 恢复 线程 ， 如 果 并 发 进行 的 话 ， 无 论调 用 时 
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是 否 进 行 了 同步 ， 目 标 线程 都 是 存在 死 锁 的 风险 ， 如 果 suspend0 中 断 的 线程 就 是 即将 要 执行 
resume0 的 那个 线程 ， 那 就 肯定 要 产生 死 锁 了 。 也 正 是 由 于 这 个 原因 ，suspend0 和 resume0 方 法 
已 经 被 JDK 声明 废弃 (@Deprecated) 了 .常见 的 线程 对 立 的 操作 还 有 System.setm0、Sytem.setOutO 
和 System. runFinalizersOnExitO 等 。 


10.1.6 ”线程 安全 的 实现 方法 


了 解 了 什么 是 线程 安全 后 ， 紧 接着 的 一 个 问题 就 是 我 们 应 该 如 何 实现 线程 安全 ， 这 听 起 来 
似乎 是 一 件 由 代码 如 何 编写 来 决定 的 事情 ， 确 实 ， 如 何 实现 线程 安全 与 代码 的 编写 有 很 大 的 关 
系 ， 但 虚拟 机 提供 的 同步 和 锁 机 制 也 起 到 了 非常 重要 的 作用 。 本 节 将 介绍 代码 编写 如 何 实现 线 
程 安全 和 虚拟 机 如 何 实现 同步 与 锁 ， 相 对 而 言 更 偏重 后 者 一 些 ， 只 要 读者 了 解 了 虚拟 机 线程 安 
全 手段 的 运作 过 程 ， 自 己 去 思考 代码 如 何 编写 并 不 是 一 件 困难 的 事情 。 


1. ERAS 


互 斥 同步 (Mutual Exclusion&Synchronization) 是 最 常见 的 一 种 并 发 正确 性 保障 手段 。 同 步 是 
指 在 多 个 线程 并 发 访问 共享 数据 时 ， 保 证 共享 数据 在 同一 个 时 刻 只 被 一 条 (或 者 是 一 些 ， 使 用 信 
号 量 的 时 候 ) 线 程 使 用 。 而 互 斥 是 实现 同步 的 一 种 手段 ， 临 界 区 (Critical Section)、 互 斥 量 (Mutex) 
和 信号 量 (Semaphore) 都 是 主要 的 互 斥 实现 方式 。 

因此 在 这 4 AFE, HEFER, APER: 互 斥 是 方法 ， 同 步 是 目的 。 在 Java 里 ， 最 基 
本 的 互 斥 同步 手段 就 是 synchronized 关键 字 ，synchronized 关键 字 经 过 编译 后 ， 会 在 同步 块 的 前 
后 分 别 形成 monitorenter 和 monitorexit 两 个 字 节 码 指令 ， 这 两 个 字 节 码 都 需要 一 个 reference 类 
型 的 参数 来 指明 要 锁定 和 解锁 的 对 象 。 如 果 Java 程序 中 的 synchronized 明确 指定 了 对 象 参数 ， 
那 就 是 这 个 对 象 的 reference; 如 果 没 有 明确 指定 , 那 就 根据 synchronized 修饰 的 是 实例 方法 还 是 
类 方法 ， 去 取 对 应 的 对 象 实例 或 Class 对 象 来 作为 锁 对 象 。 

根据 Java 虚拟 机 规范 的 要 求 ， 在 执行 monitorenter 指令 时 ， 首 先 要 去 尝试 获取 对 象 的 锁 。 
如 果 这 个 对 象 没 被 锁定 ， 或 者 当前 线程 已 经 拥有 了 那个 对 象 的 锁 ， 把 锁 的 计数 器 加 1. 相应 的 ， 
在 执行 monitorexit 指令 时 会 将 锁 计数 器 减 1， 当 计数 器 为 0 时 ， 锁 就 被 释放 了 。 如 果 获 取 对 象 
锁 失败 了 ， 那 当前 线程 就 要 阻塞 等 待 ， 直 到 对 象 锁 被 男 外 一 个 线程 释放 为 止 。 

在 Java 虚拟 机 规范 对 monitorenter 和 monitorexit 的 行为 描述 中 , 有 两 点 是 需要 特别 注意 的 。 
首先 ，synchronized 同步 块 对 同一 条 线程 来 说 是 可 重 入 的 ， 不 会 出 现 自己 把 自己 锁 死 的 问题 。 其 
次 ， 同 步 块 在 已 进入 的 线程 执行 完 之 前 ， 会 阻塞 后 面 其 他 线程 的 进入 。 上 一 章 讲 过 ，Java 的 线 
程 是 映射 到 操作 系统 的 原生 线程 上 的 ， 如 果 要 阻塞 或 唤醒 一 条 线程 ， 都 需要 操作 系统 来 帮忙 完 
成 ， 这 就 需要 从 用 户 态 转换 到 核心 态 中 ， 因 此 状态 转换 需要 耗费 很 多 的 处 理 器 时 间 。 对 于 代码 
简单 的 同步 块 (如 被 synchronized 修饰 的 getter0 或 setter0 方 法 ), 状态 转换 消耗 的 时 间 可 能 比 用 户 
代码 执行 的 时 间 还 要 长 。 所 以 synchronized 是 Java 中 一 个 重量 级 (Heavyweight) 的 操作 ， 有 经 验 
的 程序 员 都 会 在 确实 必要 的 情况 下 才 使 用 这 种 操作 。 而 虚拟 机 本 身 也 会 进行 一 些 优化 ， 壁 如 在 
通知 操作 系统 阻塞 线程 之 前 加 入 一 段 自 旋 等 待 过 程 ， 避 人 免 频繁 地 切入 到 核心 态 中 。 

除了 synchronized 外 ， 我 们 还 可 以 使 用 java.util.concurrent( 下 文 称 JU.C) 包 中 的 重 入 锁 
(ReentrantLock) 来 实现 同步 。 在 基本 用 法 上 ，ReentrantLock 与 synchronized 很 相似 ， 都 具备 一 样 
的 线程 重 入 特性 ， 只 是 代码 写法 上 有 点 区 别 ， 一 个 表现 为 API 层面 的 互 斥 锁 (lock0 和 unlock0 方 
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法 配合 try/finally 语句 块 来 完成 )， 一 个 表现 为 原生 语法 层面 的 互 斥 锁 。 不 过 ReentrantLock 比 
synchronized 增加 了 一 些 高 级 功能 ， 主 要 有 以 下 三 项 : 等 待 可 中 断 、 可 实现 公平 锁 ， 以 及 锁 绑 定 
多 个 条 件 。 

O “等 待 可 中 断 是 指 当 持 有 锁 的 线程 长 期 不 释放 锁 的 时 候 ， 正 在 等 待 的 线程 可 以 选择 放弃 
等 待 ， 改 为 处 理 其 他 事情 ， 可 中 断 特性 对 处 理 执行 时 间 非 常 长 的 同步 块 很 有 帮助 。 

口 “ 可 实现 公平 锁 是 指 多 个 线程 在 等 待 同一 个 锁 时 ， 必 须 按照 申请 锁 的 时 间 顺 序 来 依次 获 
得 锁 ; 而 非 公平 锁 则 不 保证 这 一 点 ， 在 锁 被 释放 时 ， 任 何 一 个 等 待 锁 的 线程 都 有 机 会 
获得 锁 。synchronized 中 的 锁 是 非 公 平 的 ，ReentrantLock 默认 情况 下 也 是 非 公 平 的 ， 
但 可 以 通过 带 布尔 值 的 构造 函数 要 求 使 用 公平 锁 。 

口 ” 锁 绑 定 多 个 条 件 是 指 一 个 ReentrantLock 对 象 可 以 同时 绑 定 多 个 Condition 对 象 ， 而 在 
synchronized 中 , 锁 对 象 的 wait Al notify0 或 notifyAll0 方 法 可 以 实现 一 个 隐 含 的 条 件 ， 
如 果 要 和 多 于 一 个 的 条 件 关 联 的 时 候 ， 就 不 得 不 额外 地 添加 一 个 锁 ， 而 ReentrantLock 
则 无 须 这 样 做 ， 只 需要 多 次 调用 newCondition0 方 法 即 可 。 

如 果 需 要 使 用 到 上 述 功 能 时 ， 选 用 ReentrantLock 是 一 个 很 好 的 选择 。 如 果 是 基于 性 能 考虑 
的 话 ， 经 过 实践 证 明 ， 多 线程 环境 下 synchronized 的 吞吐 量 下 降 得 非常 严重 ， 而 ReentrantLock 
则 能 基本 保持 在 同一 个 比较 稳定 的 水 平 上 。 与 其 说 ReentrantLock 的 性 能 好 ， 倒 还 不 如 说 
synchronized 还 有 非常 大 的 优化 余地 。 后 续 的 技术 发 展 也 证 明了 这 一 点 。JDK L6 中 加 入 了 很 多 
针对 锁 的 优化 措施 (下 一 节 我 们 就 会 讲解 这 些 优 化 措施 )，JDK L6 发 布 后 ， 人 们 就 发 现 
synchronized 与 ReentrantLock 的 性 能 基本 上 是 完全 持平 了 。 因 此 如 果 读 者 的 程序 是 使 用 JDK L6 
部 署 的 话 ， 性 能 因素 就 不 再 是 选择 ReentrantLock 的 理由 了 ， 虚 拟 机 在 未 来 的 性 能 改进 中 肯定 也 
会 更 加 偏向 于 原生 的 synchronized， 所 以 还 是 提倡 在 synchronized 能 实现 需求 的 情况 下 ， 优 先 考 
虑 使 用 synchronized 来 进行 同步 。 


2. 非 阻塞 同步 


互 斥 同步 最 主要 的 问题 就 是 进行 线程 阻塞 和 唤醒 所 带 来 的 性 能 问题 ， 因 此 这 种 同步 也 被 称 
为 阻塞 同步 (Blocking Synchronization)。 另 外 ， 它 属于 一 种 悲观 的 并 发 策略 ， 总 是 认为 只 要 不 去 
做 正确 的 同步 措施 (加 锁 )， 那 就 肯定 会 出 现 问题 ， 无论 共享 数据 是 否 真 的 会 出 现 澡 争 ， 它 都 要 进 
行 加 锁 ( 这 里 说 的 是 概念 模型 ， 实 际 上 虚拟 机 会 优化 掉 很 大 一 部 分 不 必要 的 加 锁 )、 用 户 态 核心 态 
转换 、 维 护 锁 计数 器 和 检查 是 否 有 被 阻塞 的 线程 需要 被 唤醒 等 操作 。 随 着 硬件 指令 集 的 发 展 ， 
我 人 有 了 另外 一 个 选择 : 基于 冲突 检测 的 乐观 并 发 策略 ， 通 俗 地 说 就 是 先进 行 操 作 ， 如 果 没 有 
其 他 线程 争 用 共享 数据 ， 那 操作 就 成 功 了 ; 如 果 共 享 数据 有 争 用 ， 产 生 了 冲突 ， 那 就 再 进行 其 
他 的 补偿 措施 (最 常见 的 补偿 措施 就 是 不 断 地 重 试 , 直到 试 成 功 为 止 ), 这 种 乐观 的 并 发 策略 的 许 
多 实现 都 不 需要 把 线程 挂 起 ， 因 此 这 种 同步 操作 被 称 为 非 阻塞 同步 (Non-Blocking 
Synchronization)。 

为 什么 编者 说 使 用 乐观 并 发 策略 需要 “硬件 指令 集 的 发 展 ” 才 能 进行 呢 ? 因为 我 们 需要 操 
作 和 冲突 检测 这 两 个 步骤 具备 原子 性 ， 靠 什么 来 保证 呢 ? 如 果 这 里 再 使 用 互 斥 同步 来 保证 就 失 
去 意义 了 ， 所 以 我 们 只 能 靠 硬件 来 完成 这 件 事情 ， 硬 件 保证 一 个 从 语义 上 看 起 来 需要 多 次 操作 
的 行为 只 通过 一 条 处 理 器 指令 就 能 完成 ， 这 类 指令 常用 的 有 以 下 几 种 。 

Q ”测试 并 设置 ( Test-and-Set). 

Q ”获取 并 增加 ( Fetch-and-Increment)。 


<9 


Ñ 。 深 入 理解 Android 虚拟 机 六 


O 交换 (Swap)。 

UO ”比较 并 交换 (Compare-and-Swap， 下 文 称 CAS). 

口 ” 加 载 链接 /条 件 储存 (Load-Linked/Store-Conditional， 下 文 称 LL/SC)。 

JOH, 前面 的 三 条 是 20 世纪 就 已 经 存在 于 大 多 数 指令 集 之 中 的 处 理 器 指令 ， 后面 的 两 条 是 
在 现代 处 理 器 中 新 增 的 ， 而 且 这 两 条 指令 的 目的 和 功能 是 类 似 的 。 在 IA64、x86 指令 集中 通过 
cmpxchg 指令 完成 CAS 功能 , 在 sparc-TSO 中 也 有 CAS 指令 实现 , 而 在 ARM 和 PowerPC 架构 
下 ， 则 需要 使 用 一 对 ldrex/strex 指令 来 完成 LL/SC 的 功能 。 

CAS 指令 需要 有 三 个 操作 数 ， 分 别 是 内 存 位 置 (在 Java 中 可 以 简单 理解 为 变量 的 内 存 地 址 ， 
JH V 表示 )、 旧 的 预期 值 (用 A 表示 ) 和 新 值 (用 B 表示 )。CAS 指令 执行 时 ， 当 且 仅 当 V 符合 旧 预 
期 值 A 时， 处理 器 用 新 值 B 更 新 V 的 值 ， 否 则 它 就 不 执行 更 新 ， 但 是 不 管 是 否 更 新 了 V 的 值 ， 
都 会 返回 V 的 旧 值 ， 上 述 的 处 理 过程 是 一 个 原子 操作 。 

在 JDK LS 之 后 ，Java 程序 中 才 可 以 使 用 CAS 操作 ， 该 操作 由 sun.misc.Unsafe 类 里 的 
compareAndSwapInt()fil compareAndSwapLong0 等 几 个 方法 包装 提供 , 虚拟 机 在 内 部 对 这 些 方法 
做 了 特殊 处 理 ， 即 时 编译 出 来 的 结果 就 是 一 条 平台 相关 的 处 理 器 CAS 指令 ， 没 有 方法 调用 的 过 
程 ， 或 者 可 以 认为 是 无 条 件 内 联 进去 了 。 

由 于 Unsafe 类 不 是 提供 给 用 户 程序 调用 的 类 (Unsafe.getUnsafe0 的 代码 中 限制 了 只 有 启动 类 
加 载 器 (Bootstrap ClassLoader) 加 载 的 Class 才能 访问 它 ), 如 果 不 采用 反射 手段 , 我 们 只 能 通过 其 
他 的 Java API 来 间接 使 用 它 ， 如 IU.C 包 里 面 的 整数 原子 类 ， 其 中 的 compareAndSetO 和 
getAndIncrement() 等 方法 都 使 用 了 Unsafe 类 的 CAS 操作 。 

接 下 来 举 一 个 例子 来 说 明 如 何 使 用 CAS 操作 来 避免 阻塞 同步 ， 例 子 的 目的 是 通过 20 个 线 
程 自 增 10000 次 的 代码 来 证 明 volatile 变量 不 具备 原子 性 ,那么 如 何 才能 让 它 具 备 原子 性 呢 ? 把 

“racet+” 操 作 或 increase0 方 法 用 同步 块 包 里 起 来 当然 是 一 个 办 法 。 例 如 在 如 下 的 演示 代码 中 ， 
通过 Atomic 的 原子 自 增 运算 的 方式 提高 了 处 理 效率 。 

public class AtomicTest { 

public static AtomicInteger race-new AtomicInteger(0)j 

public static void increase() ( 

race .incrementAndGet () ; 


} 

private static final int THREADS COUNT=20; 
public static void main{String[] args) throws Exception{ 
Thread[] threads-new Thread [THREADS COUNT]; 
for (int i-oj i(THREADS-COUNT; i++) { 
threads [i] -new Thread(new Runnable() { 
GOverride 

public void run() { 

for (int i-0;i1«10000; i++) { 

increase (); 

} 

} 

ni 

threads Lid .start(); 

} 

while (Thread.activeCount() >1) 
Thread.yield(); 

System.out .print1n (race) ; 
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} 

} 
运行 结果 如 下 。 
200000 


使 用 AtomicInteger 代 蔡 int 后 ,程序 输出 了 正确 的 结果 , 这 一 切 都 要 归功 于 incrementAndGetO 
方法 在 一 个 无 限 循 环 中 ， 不 断 尝试 将 一 个 比 当前 值 大 1 的 新 值 赋 值 给 自己 。 如 果 失 败 了 ， 那 说 
明 在 执行 “获取 -设置 ”操作 时 值 已 经 有 了 修改 ， 于 是 再 次 循环 进行 下 一 次 操作 ， 直 到 设置 成 功 
为 止 。 

RE CAS 看 起 来 很 美 ， 但 显然 这 种 操作 无 法 涵盖 互 斥 同步 的 所 有 使 用 场景 ， 并 且 CAS 从 
语义 上 来 说 并 不 是 完美 的 ， 存 在 这 样 的 一 个 逻辑 漏洞 ， 如 果 一 个 变量 V 初次 读 取 时 是 A 值 ， 并 
且 在 准备 赋值 的 时 候 检查 到 它 仍 然 为 A 值 ， 那 我 们 就 能 说 它 的 值 没有 被 其 他 线程 改变 过 了 吗 ? 
如 果 在 这 段 期 间 它 的 值 曾经 被 改 成 了 B， 后 来 又 被 改 回 为 A， 那 CAS 操作 就 会 误 认 为 它 从 来 没 
有 被 改变 过 。 这 个 漏洞 称 为 CAS 操作 的 “ABA” 问 题 。J.U.C 包 为 了 解决 这 个 问题 ， 提 供 了 一 
个 带 有 标记 的 原子 引用 类 “AtomicStampedReference”， 它 可 以 通过 控制 变量 值 的 版 本 来 保证 
CAS 的 正确 性 。 不 过 目前 来 说 这 个 类 比较 鸡肋 , 大 部 分 情况 下 ABA 问题 不 会 影响 程序 并 发 的 正 
确 性 ， 如 果 需 要 解决 ABA 问题 ， 改 用 传统 的 互 斥 同步 可 能 会 比 原子 类 更 高 效 。 


3. 无 同步 方案 


要 保证 线程 安全 ， 并 不 是 一 定 就 要 进行 同步 ， 两 者 没有 因果 关系 。 同 步 只 是 保障 共享 数据 
在 争 用 时 保持 正确 性 的 手段 ， 如 果 一 个 方法 本 来 就 不 涉及 共享 数据 ， 那 它 自然 就 无 须 任何 同步 
措施 去 保证 正确 性 ， 因 此 会 有 一 些 代 码 天 生 就 是 线程 安全 的 ， 下 面 简单 介绍 其 中 的 两 类 。 

(1) 可 重 入 代码 (Reentrant Code): 这 种 代码 也 叫 纯 代码 (Pure Code), 可 以 在 代码 执行 的 任何 
时 刻 中 断 它 ， 转 而 去 执行 另外 一 段 代码 (包括 递归 调用 它 本 身 ), 而 在 控制 权 返 回 后 ， 原 来 的 程序 
不 会 出 现任 何 错误 。 相 对 线程 安全 来 说 ， 可 重 人 性 是 更 基本 的 特性 ， 它 可 以 保证 线程 安全 ， 即 
所 有 的 可 重 入 代码 都 是 线程 安全 的 ， 但 是 并 非 所 有 的 线程 安全 的 代码 都 是 可 重 入 的 。 

可 重 入 代码 有 一 些 共同 的 特征 : 例如 ， 不 依赖 存储 在 堆 上 的 数据 和 公用 的 系统 资源 、 用 到 
的 状态 量 都 由 参数 中 传 入 、 不 调用 非 可 重 入 的 方法 等 。 我 们 可 以 通过 一 个 简单 一 些 的 原则 来 判 
断代 码 是 否 具备 可 重 入 性 : 如 果 一 个 方法 ， 它 的 返回 结果 是 可 以 预测 的 ， 只 要 输入 了 相同 的 数 
据 ， 就 都 能 返回 相同 的 结果 ， 那 它 就 满足 可 重 入 性 的 要 求 ， 当 然 也 就 是 线程 安全 的 。 

Q) 线程 本 地 存储 (Thread Local Storage): 如 果 一 段 代码 中 所 需要 的 数据 必须 与 其 他 代码 共 
享 ， 那 就 看 看 这 些 共享 数据 的 代码 是 否 能 保证 在 同一 个 线程 中 执行 ? 如 果 能 保证 ， 我 们 就 可 以 
把 共享 数据 的 可 见 范 围 限制 在 同一 个 线程 内 ， 这 样 ， 无 须 同步 也 能 保证 线程 之 间 不 出 现 数 据 争 
用 的 问题 。 

符合 这 种 特点 的 应 用 并 不 少见 ， 大 部 分 使 用 消费 队列 的 架构 模式 (如 “生产 者 -消费 者 ” 模 
式 ) 都 会 将 产品 的 消费 过 程 尽量 在 一 个 线程 中 消费 完 ， 其 中 最 重要 的 一 个 应 用 实例 就 是 经 典 Web 
交互 模型 中 的 “一 个 请 求 对 应 一 个 服务 器 线程 ”(Thread-per-Requesb 的 处 理 方式 ， 这 种 处 理 方式 
的 广泛 应 用 使 得 Web 服务 器 端的 很 多 应 用 都 可 以 使 用 线程 本 地 存储 来 解决 线程 安全 问题 。 

在 Java 中 ， 如 果 一 个 变量 要 被 多 线程 访问 ， 可 以 使 用 volatile 关键 字 声明 它 为 “ 易 变 的 ”; 
如 果 一 个 变量 要 被 某 个 线程 独 享 ， 虽 然 Java 中 没有 类 似 C++ 中 _declspec(thread) 这 样 的 关键 字 ， 
但 可 以 通过 java.lang.TbreadLocal 类 来 实现 线程 本 地 存储 的 功能 。 每 一 个 线程 的 Thread 对 象 中 
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都 有 一 个 ThreadLocaIMap 对 象 , 这 个 对 象 存储 了 一 组 以 ThreadLocal.threadLocalHashCode 为 键 ， 
以 本 地 线程 变量 为 值 的 K-V 值 对 ，ThreadLocal 对 象 就 是 当前 线程 的 ThreadLocaIMap 的 访问 入 
口 ， 每 一 个 ThreadLocal 对 象 都 包含 了 一 个 独一无二 的 threadLocalHashCode 值 ， 使 用 这 个 值 就 
可 以 在 线程 K-V 值 对 中 找 回 对 应 的 本 地 线程 变量 。 


10.1.7 无 状态 类 


线程 安全 的 类 一 般 是 无 状态 的 对 象 ， 或 者 类 里 面 的 变量 是 不 可 变 的 ， 下 面 举例 说 明 什么 是 


public class StatelessFactorizer implements Servlet { 
public void service (ServletRequest req, ServletResponse resp) { 
BigInteger i = extractFromRequest (req); 
BigInteger[] factors = factor(i); 
encodeIntoResponse (resp, factors); 
) 
} 


跟 线程 模型 有 关系 ， 因 为 每 个 线程 都 有 自己 的 变量 ， 并 且 变 量 放 在 自己 的 线程 堆栈 中 (除了 
共享 变量 )， 所 以 说 无 论 多 个 线程 怎么 访问 ， 该 线程 类 都 是 安全 。 
也 许 有 人 会 问 是 什么 样 的 操作 是 原子 性 的 呢 ? 例子 代码 如 下 。 


count++; 


这 个 操作 是 原子 性 的 吗 ? 好 像 单 道 程序 中 该 操作 是 原子 性 ， 但 在 早 多 线程 中 该 操作 不 是 原 
THE: 该 操作 分 为 读 、 修 改 、 写 入 ， 因 此 该 操作 就 会 在 多 个 线程 中 执行 时 会 被 切换 ， 也 就 说 明 
该 操作 会 在 执行 过 程 中 被 切换 给 下 一 个 线程 。 

代码 如 下 。 


public class UnsafeCountingFactorizer implements Servlet { 
private long count - 0; 
public long getCount() ( return count; ] 
public void service(ServletRequest req, ServletResponse resp) { 
BigInteger i - extractFromRequest (req); 
BigInteger[] factors - factor(i); 
++count; 
encodeIntoResponse (resp, factors); 
} 
} 


上 述 例子 有 一 个 私有 的 但 是 多 个 线程 共享 的 变量 ， 而 在 Service 方法 中 该 方法 体 里 面 执 行 了 
++count， 所 以 该 类 不 是 线程 安全 的 。 类 失去 原子 性 操作 的 另 一 个 典型 是 : 检查 在 运行 ， 下 面 就 
为 大 家 举 个 单 例 模式 中 的 懒 加 载 问题 。 


public class LazyInitRace { 
private ExpensiveObject instance = null; 
public ExpensiveObject getInstance() { 
if (instance == null) 
instance = new ExpensiveObject(); 
return instance; 
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} 
} 
在 多 线程 中 运行 该 getInstance 方法 时 ， 有 可 能 两 个 或 以 上 的 线程 会 判断 instance 为 空 。 所 
以 说 要 尽量 在 判断 和 新 建 对 象 时 不 要 被 线程 切换 ， 也 就 是 说 保持 操作 的 原子 性 时 那么 该 类 就 是 
线程 安全 。 
下 面 为 大 家 曾 明 上 面 出 现 的 两 个 问题 的 解决 方案 。 
(1) 要 想 解 决 原子 性 的 操作 就 需要 给 这 些 操作 加 锁 。 
(2) 要 让 每 个 线程 知道 ， 当 有 个 线程 修改 对 象 或 者 修改 变量 时 ， 其 他 线程 都 要 可 见 ， 这 个 
关系 到 JVM 的 类 存 模型 。 
首先 第 一 个 问题 read-modify-write 解决 方案 ,我 们 引用 了 JDK 包 中 的 java.lang.concurrent.atomic， 
该 包 里 面 可 以 让 变量 保持 原子 性 操作 ， 有 具体 类 的 简单 介绍 如 下 。 
AtomicBoolean: 可 以 用 原子 方式 更 新 的 boolean 值 。 
AtomicInteger: 可 以 用 原子 方式 更 新 的 int 值 。 
AtomicIntegerArray: 可 以 用 原子 方式 更 新 其 元 素 的 int 数组 。 
AtomicIntegerFieldUpdater<T>: 基于 反射 的 实用 工具 , 可 以 对 指定 类 的 指定 volatile int 
字段 进行 原子 更 新 。 
O  AtomicLong: 可 以 用 原子 方式 更 新 的 long 值 。 
O ”AtomicLongArray: 可 以 用 原子 方式 更 新 其 元 素 的 long 数组 。 
ū AtomicLongFieldUpdater-T»: 基于 反射 的 实用 工具 ， 可 以 对 指定 类 的 指定 volatile long 
字段 进行 原子 更 新 。 
Q  AtomicMarkableReferencecV^: AtomicMarkableReference 维护 带 有 标记 位 的 对 象 引用 ， 
可 以 原子 方式 对 其 进行 更 新 。 
AtomicReference<V>: 可 以 用 原子 方式 更 新 的 对 象 引用 。 
AtomicReferenceArray<E>: 可 以 用 原子 方式 更 新 其 元 素 的 对 象 引用 数组 。 
AtomicReferenceFieldUpdater<T,V>: 基于 反射 的 实用 工具 ， 可 以 对 指定 类 的 指定 
volatile 字段 进行 原子 更 新 。 
O  AtomicStampedReference-V^: AtomicStampedReference 维护 带 有 整数 “标志 ”的 对 象 
引用 ， 可 以 用 原子 方式 对 其 进行 更 新 。 
例如 下 面 的 代码 。 
public class CountingFactorizer implements Servlet { 
private final AtomicLong count = new AtomicLong(0); 
public long getCount() { return count.get(); } 
public void service(ServletRequest reg, ServletResponse resp) ( 
BigInteger i - extractFromRequest (req); 
BigInteger[] factors - factor(i); 
count . incrementAndGet () ; 


encodeIntoResponse(resp, factors) ; 


} 


oooo 


ooo 


} 
第 二 个 问题 的 解决 方案 就 是 加 上 关键 字 sychronized. 
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10.2 Android 的 线程 模型 


Android 包括 一 个 应 用 程序 框架 、 几 个 应 用 程序 库 和 一 个 基于 Dalvik 虚拟 机 的 运行 时 , 所 有 
这 些 都 运行 在 Linux 内 核 上 。 通 过 利用 Linux 内 核 的 优势 ，Android 得 到 了 大 量 操作 系统 服务 ， 
包括 进程 和 内 存 管 理 、 网 络 堆栈 、 了 驱动 程序 、 硬 件 抽象 层 、 安 全 性 等 相关 的 服务 。 

在 安装 Android 应 用 程序 时 ，Android 会 为 每 个 程序 分 配 一 个 Linux 用 户 ,并 设置 相应 的 
权限 ， 这 样 其 他 应 用 程序 就 不 能 访问 此 应 用 程序 所 拥有 的 数据 和 资源 了 。 

1E Linux 中 ， 一 个 用 户 ID 识别 一 个 给 定 用 户 。 在 Android 上 ， 一 个 用 户 ID 识别 一 个 应 用 
程序 。 应 用 程序 在 安装 时 被 分 配 用 户 ID， 应 用 程序 在 设备 上 的 存续 期 间 内 ， 用 户 ID 保持 不 变 。 

在 默认 情况 下 , 每 个 APK 运行 在 它 自己 的 Linux 进程 中 。 当 需 要 执行 应 用 程序 中 的 代码 时 ， 
Android 会 启动 一 个 JVM， 即 一 个 新 的 进程 来 执行 ， 因 此 不 同 的 apk 运行 在 相互 隔离 的 环境 中 。 

如 图 10-2 所 示 为 两 个 Android 应 用 程序 ， 各 自在 其 基本 沙 箱 或 进程 上 ， 拥 有 不 同 的 Linux 
用 户 ID. 


Android application/process space 


App Sandbox Linux user ID: 12345 


Application 
Linux user ID: 12345 


App Sandbox Linux user ID: 54321 


Application 
Linux user ID: 54321 


Resources. 
Linux user ID: 12345 


Two applications on different processes (with different user-ids) 
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10-2 FS Android 应 用 程序 


开发 者 也 可 以 给 两 个 应 用 程序 分 配 相同 的 Linux 用 户 ID， 这 样 他 们 就 能 访问 对 方 所 拥有 的 
资源 。 为 了 保留 系统 资源 ， 拥 有 相同 用 户 ID 的 应 用 程序 可 以 运行 在 同一 个 进程 中 ， 共 享 同 一 个 
Java 虚拟 机 。 

如 图 10-3 所 示 为 两 个 运行 在 同一 进程 上 的 Android 应 用 程序 。 不 同 的 应 用 程序 可 以 运行 在 
相同 的 进程 中 ， 要 想 实现 这 个 功能 ， 首 先 必 须 使 用 相同 的 私 钥 签署 这 些 应 用 程序 ， 然 后 必须 使 
用 manifest 文件 给 它们 分 配 相 同 的 Linux 用 户 ID， 这 通过 用 相同 的 “ 值 /名 ”定义 manifest 属性 
android:sharedUserId 来 实现 。 


> 
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Android application/process space 


App Sandbox: Linux user ID: 12345 


Application Application 
Linux user ID: 12345 Linux user ID: 12345 


Resources 
Linux user ID: 12345 


[Jr P e] fe BS d 
Due] Dd] pee] DIES 


Two applications signed using the same digital signature and assigned the 
same Linux user-id 
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10-3 ”两 个 运行 在 同一 进程 上 的 Android 应 用 程序 


10.2.1 Android 的 单线 程 模型 


当 第 一 次 启动 一 个 程序 时 ，Android 会 同时 启动 一 个 对 应 的 主线 程 (Main Thread)。 主 线程 主 
要 负责 处 理 与 UI 相关 的 事件 ， 如 用 户 的 按键 事件 ， 用 户 接触 屏幕 的 事件 以 及 屏幕 绘图 事件 ， 并 
把 相关 的 事件 分 发 到 对 应 的 组 件 进行 处 理 ， 所 以 主线 程 通常 又 被 叫 作 UI 线程。 

在 开发 Android 应 用 程序 时 必须 遵守 单线 程 模型 的 原则 : Android UI 操作 并 不 是 线程 安全 
的 ， 并 且 这 些 操作 必须 在 UI 线程 中 执行 。 

如 果 在 非 UI 线程 中 直接 操作 UI 线程 ， 则 会 抛 出 如 下 异常 : 

android.view.ViewRoot$CalledFromWrongThreadException: Only the original thread that 

created a view hierarchy can touch its views 

这 与 普通 的 Java 程序 是 不 同 的 。 

由 于 UI 线程 负责 事件 的 监听 和 绘图 处 理 , 因此 必须 保证 UI 线程 能 够 随时 响应 用 户 的 需求 ， 
UI 线程 里 的 操作 应 该 像 中 断 事件 那样 短小 ， 费 时 的 操作 (如 网 络 连接 ) 需 要 另 开 线程 ， 否 则 ， 如 
果 UI 线程 超过 5s 没有 响应 用 户 请 求 ， 会 弹出 对 话 框 提醒 用 户 终止 应 用 程序 。 

如 果 在 新 开 的 线程 中 需要 对 UI 线程 进行 设 定 ， 就 可 能 违反 单线 程 模 型 ， 因 此 Android 采用 
一 种 复杂 的 Message Queue 机 制 保证 线程 间 的 通信 。 


10.2.2 Message Queue 


Message Queue 是 一 个 消息 队列 ， 用 来 存放 通过 Handler 发 布 的 消息 。Android 在 第 一 次 启 
动 程序 时 会 默认 会 为 U 线程 创建 一 个 关联 的 消息 队列 , 通过 Looper.myQueue0 得 到 当前 线程 的 
消息 队列 ， 用 来 管理 程序 的 一 些 上 层 组 件 ， 例 如 activities 和 broadcast receivers 等 。 我 们 可 以 在 
自己 的 子 线程 中 创建 Handler 5 UI thread 通信 。 

通过 Handler 可 以 发 布 或 者 处 理 一 个 消息 或 者 是 一 个 Runnable 的 实例 , 每 个 Handler 都 会 与 
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唯一 的 一 个 线程 以 及 该 线程 的 消息 队列 关联 。Looper 扮演 着 一 个 Handler 和 消息 队列 之 间 通 信 
桥梁 的 角色 .程序 组 件 首先 通过 Handler 把 消息 传递 给 Looper, Looper 再 把 消息 放 入 队列 .Looper 
也 把 消息 队列 里 的 消息 广播 给 所 有 的 Handler, Handler 接收 到 消息 后 调用 handleMessage 进行 处 
理 。 例 如 下 面 的 演示 代码 。 


public void onCreate(Bundle savedInstanceState) { 
super.onCreate (savedInstanceState) ; 
setContentView(R.layout .main) ; 
editText = (EditText) findViewById(R.id.weather city edit); 
Button button - (Button) findViewById(R.id.goQuery); 
button.setOnClickListener (this); 
Looper looper = Looper.myLooper(); // 得 到 当前 线程 的 Looper 实例 ， 由 于 当前 线程 是 UI 线程 也 可 
以 通过 Looper .getMainLooper() 得 到 
messageHandler = new MessageHandler(looper); // 此 处 甚至 可 以 不 需要 设置 Looper, AW 
Handler 默认 就 使 用 当前 线程 的 Looper 
} 
public void onclick(View v) { 
new Thread() ( 
public void run() { 
Message message - Message.obtain(); 
message.obj - "abc"; 
messageHandler.sendMessage(message); // 发 送 消息 
} 


}.start (); 


Handler messageHandler = new Handler { 
public MessageHandler(Looper looper) { 
super (looper) ; 
} 
public void handleMessage (Message msg) { 
setTitle((String) msg.obj); 
} 
} 


对 于 上 述 演 示 代 码 ， 当 这 个 activity 执行 完 oncreate, onstart 和 onresume 后 ， 就 监听 UI £X 


程 的 各 种 事件 和 消息 。 当 我 们 单 击 一 个 按钮 后 ， 启 动 一 个 线程 ， 线 程 执行 结束 后 ， 通 过 handler 
发 送 一 个 消息 ， 由 于 这 个 handler 属于 UI 线程 ， 因 此 这 个 消息 也 发 送 给 UI 线程 ， 然 后 UI 线程 
又 把 这 个 消息 给 handler 处 理 ， 而 这 个 handler 因为 是 UI 线程 创造 的 ， 所 以 可 访问 UI 组 件 ， 因 
此 就 更 新 了 页 面 。 


由 于 通过 handler 需要 自己 管理 线程 类 ， 如 果 业 务 稍微 复杂 ， 代 码 看 起 来 就 比较 混乱 ， 因 此 


Android 提供 了 类 AsyncTask 来 解决 这 个 问题 。 


10.2.3 AsyncTask 
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首先 继承 类 publishProgress， 实 现 如 下 的 方法 。 

口 ”onPreExecute0: 该 方法 将 在 执行 实际 的 后 台 操作 前 被 UI 线程 调用 。 可 以 在 该 方法 中 
做 一 些 准 备 工 作 ， 如 在 界面 上 显示 一 个 进度 条 。 

Q dolInBackground(Params..): 在 方法 onPreExecute 执行 后 马上 执行 ， 该 方法 运行 在 后 台 
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线程 中 。 这 里 将 主要 负责 执行 那些 很 耗 时 的 后 台 计 算 工作 。 
O publishProgressQ: 更 新 实时 的 任务 进度 。 该 方法 是 抽象 方法 ， 必 须 实现 子 类 。 
Q onProgressUpdate(Progress...): 在 publishProgress 方法 被 调用 后 ，UI 线程 将 调用 这 个 方 
法 从 而 在 界面 上 展示 任务 的 进展 情况 ， 例 如 通过 一 个 进度 条 进行 展示 。 
Q onPostExecute(Result): 在 doInBackground 执行 完成 后 ，onPostExecute 方法 将 被 UI £X 
程 调用 ， 后 台 的 计算 结果 将 通过 该 方法 传递 到 UI 线程 。 
使 用 publishProgress 类 时 需要 遵循 以 下 规则 。 
O Task 的 实例 必须 在 UI 线程 中 创建 。 
O execute 方法 必须 在 UI 线程 中 调用 。 
Q ”不 要 手动 的 调用 这 些 方法 ， 只 调用 execute 即 可 。 
O 该 任务 只 能 被 执行 一 次 ， 否 则 多 次 调用 时 将 会 出 现 异常 。 
例如 下 面 的 演示 代码 。 
public void onCreate(Bundle savedInstanceState) { 
super.onCreate (savedInstanceState); 
setContentView(R.layout.main); 
editText - (EditText) findViewById(R.id.weather city edit); 


Button button = (Button) findViewById(R.id.goQuery) ; 
button.setOnClickListener (this); 


} 
public void onClick(View v) { 

new GetWeatherTask() .execute (“aaa”) ; 
} 


class GetWeatherTask extends AsyncTask<String, Integer, String> { 
protected String doInBackground(String... params) { 
return getWetherByCity (params [0] ) ; 
} 


protected void onPostExecute (String result) { 
setTitle (result); 


} 
10.3 分析 Android 的 进程 通信 机 制 


要 想 了 解 Dalvik 虚拟 机 线程 管理 的 知识 ， 需 要 首先 了 解 Android 的 内 存 系统 ， 了 解 内 存 控 
制 进程 运行 的 机 制 。 本 节 将 带领 大 家 一 起 探讨 分 析 Android 的 进程 通信 机 制 。 


10.3.1 Android 的 进程 间 通信 (IPC) 机 制 Binder 


在 Android P, 每 一 个 应 用 程序 都 是 由 一 些 Activity 和 Service 组 成 的 , 一 般 Service 运行 在 
独立 的 进程 中 ,而 Activity 有 可 能 运行 在 同一 个 进程 中 , 也 有 可 能 运行 在 不 同 的 进程 中 。 那 么 不 
在 同一 个 进程 的 Activity 或 者 Service 之 间 究 竟 是 如 何 通信 的 呢 ? 下 面 将 介绍 的 Binder 进程 间 通 
信 机 制 来 了 解 Android 是 如 何 实现 这 个 功能 的 。 

众所周知 ，Android 是 基于 Linux 内 核 的 ， 而 Linux 内 核 继承 和 兼容 了 丰富 的 Unix 系统 进 
程 间 通信 (PO) 机 制 。Linux 的 通信 机 制 有 传统 的 管道 (Pipe)、 信 号 (SignaD 和 跟踪 (Trace) 三 种 ， 这 
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三 种 通信 手段 只 能 用 于 父 进程 和 子 进程 之 间 ， 或 者 只 用 于 兄弟 进程 之 间 的 通信 。 随 着 技术 的 发 
展 ， 后 来 又 增加 了 命令 管道 Named Pipe)， 这 样 使 得 进程 之 间 的 通信 不 再 局 限于 父子 进程 或 者 兄 
弟 进 程 之 间 。 为 了 更 好 地 支持 商业 应 用 中 的 事务 处 理 ， 在 AT&T 的 Unix 系统 V 中 ， 又 增加 了 
如 下 三 种 称 为 “System V IPC” 的 进程 间 通 信 机 制 。 

O 报 文 队 列 (Message)。 

口 共享 内 存 (Share Memory)。 

Q ”信号 量 (Semaphore)。 

后 来 BSD Unix 对 “System V IPC” 机 制 进行 了 重要 的 扩充 ， 提 供 了 一 种 称 为 插口 (Socket) 
的 进程 师 间 通信 机 制 。 但 是 Android 没有 采用 上 述 提 到 的 各 种 进程 间 通 信 机 制 ， 而 是 采用 了 
Binder 机 制 ， 这 难道 仅仅 是 因为 考虑 到 了 移动 设备 硬件 性 能 较 差 、 内 存 较 低 的 特点 吗 ? 这 只 有 
Android 的 工程 师 们 知道 ， 我 们 不 得 而 知 。Binder 其 实 也 不 是 Android 提出 来 的 一 套 新 的 进程 间 
通信 机 制 ， 它 是 基于 OpenBinder 来 实现 的 。OpenBinder 最 先是 由 Be Inc. 开 发 的 ， 后 来 Palm Inc. 
也 跟着 借鉴 使 用 。 现在 OpenBinder 的 作者 Dianne Hackborn 就 在 Google 公司 工作 , 负责 Android 
平台 的 开发 工作 。 

再 次 强调 一 下 , Binder 是 一 种 进程 间 通 信 机 制 , 这 是 一 种 类 似 于 COM 和 CORBA 的 分 布 式 
组 件 架 构 。 通 俗 点 说 ， 就 是 提供 远程 过 程 调用 (RPC) 功 能 。 从 英文 字面 上 意思 看 ，Binder HA Hi 
结 剂 的 意思 ， 那 么 它 把 什么 东西 粘 接 在 一 起 呢 ? 在 Android 的 Binder 机 制 中 ， 由 一 系列 组 件 组 
成 ， 分 别 是 Client、Server、Service Manager 和 Binder 驱动 程序 ， 其 中 Client、Server 和 Service 
Manager 运行 在 用 户 空间 ,Binder 驱动 程序 运行 内 核 空间 。Binder 就 是 一 种 把 这 4 个 组 件 粘 接 在 
一 起 的 粘 结 剂 了 ， 其 中 ， 核 心 组 件 便 是 Binder 驱动 程序 ，Service Manager 提供 了 辅助 管理 的 功 
能 , Client 和 Server 正 是 在 Binder 驱动 和 Service Manager 提供 的 基础 设施 上 , 进行 Client/Server 
之 间 的 通信 。Service Manager 和 Binder 驱动 已 经 在 Android 平台 中 实现 完毕 ， 开 发 者 只 要 按照 
规范 实现 自己 的 客户 端 和 服务 器 端 组 件 即 可 。 但 是 说 起 来 简单 ， 具 体 做 起 来 却 很 难 。 对 初学 者 
Kiki, Android 的 Binder 机 制 是 最 难 理解 的 了 ， 而 Binder 机 制 无 论 从 系统 开发 还 是 应 用 开发 的 
角度 来 看 ， 都 是 Android 中 最 重要 的 组 成 ， 所 以 很 有 必要 深入 了 解 Binder 的 工作 方式 。 要 深入 
了 解 Binder 的 工作 方式 ， 最 好 的 方式 是 阅读 与 Binder 相关 的 源 代码 了 ，Linux 的 鼻祖 Linus 
Torvalds 曾经 说 过 一 名 名言 RTFSC: Read The Fucking Source Code. 

虽说 阅读 Binder 的 源 代码 是 学 习 Binder 机 制 的 最 好 方式 , 但 Binder 的 相关 源 代码 是 比较 枯 
燥 无 味 而 且 比 较 难以 理解 的 ， 如 果 能 够 辅 以 一 些 Linux 的 理论 知识 那 就 更 好 了 。 

要 想 理解 Binder 机 制 ， 就 必须 了 解 Binder 在 用 户 空间 的 三 个 组 件 Client、Server 和 Service 
Manager 之 间 的 相互 关系 ， 了 解 内 核 空 间 中 Binder 驱动 程序 的 数据 结构 和 设计 原理 。 具 体 来 说 ， 
Android 系统 Binder 机 制 中 的 四 个 组 件 Client、Server、Service Manager 和 Binder 驱动 程序 的 关 
系 图 如 图 10-4 Bras. 

对 图 10-4 所 示 关 系 的 具体 说 明 如 下 。 

(1) Client. Server 和 Service Manager 实现 在 用 户 空间 中 ，Binder 驱动 程序 实现 在 内 核 空 
间 中 。 

(2) Binder 驱动 程序 和 Service Manager 在 Android 平台 中 已 经 实现 ， 开 发 人 员 只 需要 在 用 
户 空间 实现 自己 的 客户 端 和 服务 器 端 组 件 。 

(3) Binder 驱动 程序 提供 设备 文件 /dev/binder 与 用 户 空 间 交 互 ，Client、Server 和 Service 
Manager 通过 文件 操作 函数 open0 和 ioctl0 与 Binder 驱动 程序 进行 通信 。 
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(4) 客户 端 和 服务 器 端 之 间 的 进程 间 通 信 通 过 Binder 驱动 程序 间接 实现 。 
(5) Service Manager 是 一 个 守护 进程 ， 用 来 管理 服务 器 端 ， 并 向 客户 端 提供 查询 服务 器 端 
接口 的 能 
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10-4 £Bff Client, Server, Service Manager 和 Binder 驱动 程序 的 关系 图 


10.3.2 Service Manager x Binder 机 制 的 上 下 文 管理 者 


在 


分 析 Binder 源 代码 时 ， 需 要 先 弄 清楚 Service Manager 是 如 何 告知 Binder 驱动 程序 它 是 


Binder 机 制 的 上 下 文 管理 者 的 。Service Manager 是 整个 Binder 机 制 的 守护 进程 ， 用 来 管理 开发 
人 员 创 建 的 各 种 Server， 并 且 向 Client 提供 查询 服务 器 远程 接口 的 功能 。 
因为 Service Manager 组 件 是 用 来 管理 服务 器 并 且 向 客户 端 提供 查询 服务 器 端 远程 接口 的 功 


能 ， 所 


以 Service Manager 必然 要 和 服务 器 以 及 客户 端 进行 通信 。 我 们 知道 ，Service Manger. 


Client 和 服务 器 三 者 分 别 是 运行 在 独立 的 进程 当中 的 ， 这 样 它们 之 间 的 通信 也 属于 进程 间 的 通 
信 ， 而 且 也 是 采用 Binder 机 制 进行 进程 间 通 信 。 因 此 ，Service Manager 在 充当 Binder 机 制 的 守 


护 进 程 


的 角色 的 同时 ， 也 在 充当 服务 器 的 角色 ， 但 是 它 是 一 种 特殊 的 服务 器 ， 要 想 了 解 具体 的 


特殊 之 处 请 看 下 面 的 内 容 。 


4 
Service 


包括 从 


Service Manager 相关 的 源 代码 较 多 ， 本 书 不 会 完整 地 去 分 析 每 一 行 代码 ， 主 要 是 带 着 
Manager 是 如 何 成 为 整个 Binder 机 制 中 的 守护 进程 这 条 主线 来 分 析 相 关 源 代码 ， 这 主要 


有 户 空 间 到 内 核 空间 的 相关 源 代码 。 


Service Manager 在 用 户 空间 的 源 代码 位 于 “frameworks/base/cmds/servicemanager“ 目 录 下 ， 


主要 是 


由 文件 binder.h、binder.c 和 service manager.c 组 成 。Service Manager 的 入 口 位 于 文件 


service manager.c 中 的 函数 main0 中 ， 代 码 如 下 。 


int main(int argc, char **argv) { 


struct binder_state *bs; 
void *svcmgr = BINDER_SERVICE_MANAGER; 
bs = binder_open(128*1024) ; 
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if (binder become context manager(bs)) { 
LOGE("cannot become context manager (%s)\n", strerror(errno)); 
return -1; 
} 
svcmgr handle = svcmgr; 
binder loop(bs, svcmgr handler); 
return 0; 
} 
上 述 函 数 main0 主 要 有 如 下 三 个 功能 。 
口 打开 Binder 设备 文件 。 
告诉 Binder 驱动 程序 自己 是 Binder 机 制 的 上 下 文 管理 者 , 即 我 们 前 面 所 说 的 守护 进程 。 
Q 进入 一 个 无 穷 循 环 ， 充 当 服务 器 的 角色 ， 等 待 客户 端的 请 求 。 

在 进入 上 述 三 个 功能 之 间 , 先 来 看 一 下 这 里 用 到 的 结构 体 binder_state、 宏 BINDER_SERVICE_ 
MANAGER 的 定义 ,结构 体 binder_state 定义 在 文件 frameworks/base/cmds/servicemanager/binder.c 
中 ， 代 码 如 下 。 

struct binder state { 

int fd; 
void *mapped; 
unsigned mapsize; 

hi 

其 中 fd 表示 文件 描述 符 ， 即 表示 打开 的 “/devwbinder” 设 备 文件 描述 符 ，mapped 表示 把 设 
备 文件 “/dewbinder” 映 射 到 进程 空间 的 起 始 地 址 ; mapsize 表示 上 述 内 存 映 射 空间 的 大 小 。 

7: BINDER. SERVICE MANAGER 在 文件 frameworks/base/cmds/servicemanager/binder.h 中 
定义 ， 代 码 如 下 。 

/* the one magic object */ 

#define BINDER SERVICE MANAGER ((void*) 0) 

这 表示 Service Manager 的 句柄 为 0。Binder 通信 机 制 使 用 句柄 来 代表 远程 接口 ， 此 句柄 的 
意义 和 Windows 编程 中 用 到 的 句柄 是 差不多 。 前 面 说 到 ，Service Manager 在 充当 守护 进程 的 同 
时 , 它 充当 服务 器 的 角色 , 当 它 作为 远程 接口 使 用 时 , 它 的 句柄 值 便 为 0, 这 就 是 它 的 特殊 之 处 ， 
其 余 的 服务 器 端的 远程 接口 句柄 值 都 是 一 个 大 于 0 而 且 由 Binder 驱动 程序 自动 进行 分 配 的 。 

函数 首先 打开 Binder 设备 文件 的 操作 函数 binder open0 ， 此 函数 的 定义 位 于 文件 


frameworks/base/cmds/servicemanager/binder.c 中 ， 代 码 如 下 。 


struct binder state *binder open(unsigned mapsize)( 
struct binder state *bs; 
bs = malloc(sizeof(*bs)); 
if (!bs) { 
errno = ENOMEM; 
return 0; 
} 
bs->fd = open("/dev/binder", O_RDWR) ; 
if (bs->fd < 0) { 
fprintf(stderr,"binder: cannot open device (%s)\n", 
strerror (errno) ) ; 
goto fail open; 


第 10 章 线程 管理 


} 
bs->mapsize = mapsize; 
bs->mapped = mmap (NULL, mapsize, PROT READ, MAP PRIVATE, bs->fd, 0); 
if (bs->mapped == MAP FAILED) { 
fprintf(stderr,"binder: cannot map device ($s) Wn", 
strerror(errno)); 
goto fail map; 


/* TODO: check version */ 
return bs; 
fail map: 
close (bs->fd) ; 
fail_open: 
free (bs); 
return 0; 


} 


通过 文件 操作 函数 open0 打 开设 备 文件 /devbinder, 此 设备 文件 是 在 Binder 驱动 程序 模块 初 
始 化 时 创建 的 。 接 下 来 先 看 一 下 这 个 设备 文件 的 创建 过 程 ， 来 到 kemel/common/drivers/ 
staging/android 目录 ， 打 开 文 件 binder.c， 可 以 看 到 如 下 模块 初始 化 入 口 binder init: 


static struct file operations binder fops = { 
-owner = THIS MODULE, 
.poll - binder poll, 
.unlocked ioctl - binder ioctl, 
.mmap - binder mmap, 
.open binder open, 
.flush - binder flush, 
.release - binder release, 


) 

static struct miscdevice binder miscdev - ( 
.minor - MISC DYNAMIC MINOR, 
.name - "binder", 
.fops - &binder fops 


) 


static int ^ init binder init (void) 


{ 


int ret; 


binder proc dir entry root = proc mkdir("binder", NULL); 
if (binder proc dir entry root) 
binder proc dir entry proc = proc mkdir("proc", binder proc dir entry 
root); 
ret - misc register(&binder miscdev); 
if (binder proc dir entry root) ( 
create proc read entry("state", S IRUGO, binder proc dir entry root, 
binder read proc state, NULL); 
create proc read entry("stats", S IRUGO, binder proc dir entry root, 
binder read proc stats, NULL); 
create proc read entry("transactions", S IRUGO, binder proc dir entry root, 
binder read proc transactions, NULL); 
<D 
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create proc read entry("transaction log", S IRUGO, binder proc dir entry root, 
binder read proc transaction log, &binder transaction log); 
create proc read entry ("failed transaction log", S IRUGO, binder proc 
dir entry root, binder read proc transaction log, &binder transaction log failed); 
} 
return ret; 


} 


device initcall(binder init); 


在 函数 misc register0 中 实现 了 创建 设备 文件 的 功能 ， 并 实现 了 mise 设备 的 注册 工作 ， 在 


/proc 目录 中 创建 了 各 种 Binder 相关 的 文件 供用 户 访问 。 从 设备 文件 的 操作 方法 binder fops 可 
以 看 出 ， 通 过 如 下 函数 binder_open 的 执行 语句 。 


bs->fd = open("/dev/binder", O_RDWR); 
即 可 进入 到 Binder 驱动 程序 的 binder_open0 函 数 。 


static int binder open(struct inode *nodp, struct file *filp) 


{ 


struct binder proc *proc; 


if (binder debug mask & BINDER DEBUG OPEN CLOSE) 
printk(KERN INFO "binder open: %d:%d\n", current-»group leader-»pid, 
current-»pid); 


proc - kzalloc(sizeof(*proc), GFP KERNEL); 
if (proc -- NULL) 

return -ENOMEM; 
get task struct (current); 
proc-»tsk - current; 
INIT LIST HEAD(&proc-»todo); 
init waitqueue head(&proc-»wait); 
proc-»default priority - task nice(current); 
mutex lock(&binder lock); 
binder stats.obj created[BINDER STAT PROC] ++; 
hlist add head(&proc-»proc node, &binder procs); 
proc-»pid - current-»group leader-»pid; 
INIT LIST HEAD(&proc-»delivered death); 
filp-»private data - proc; 
mutex unlock(&binder lock); 


if (binder proc dir entry proc) ( 
char strbuf [11]; 
snprintf(strbuf, sizeof(strbuf), "%u", proc-»pid); 
remove proc entry(strbuf, binder proc dir entry proc); 
create proc read entry(strbuf, S IRUGO, binder proc dir entry proc, 
binder read proc proc, proc); 


) 


return 0; 


} 
上 述 函 数 的 主要 作用 是 创建 一 个 名 为 binder proc 的 数据 结构 ， 用 此 数据 结构 来 保存 打开 设 


备 文件 /dev/binder 的 进程 上 下 文 信息 , 并 且 将 这 个 进程 上 下 文 信息 保存 在 打开 文件 结构 fie 的 私 
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有 数据 成 员 变 量 private_data 中 。 这 样 当 在 执行 其 他 文件 操作 时 ， 就 通过 打开 文件 结构 file 来 取 
这 个 进程 上 下 文 信息 了 。 这 个 进程 上 下 文 信息 同时 还 会 保存 在 一 个 全 局 哈 希 表 binder procs 
中 ， 供 驱动 程序 内 部 使 用 。 哈 希 表 binder procs 定义 在 文件 的 开头 。 


static HLIST HEAD(binder procs); 


I 


而 结构 体 struct binder proc 也 被 定义 在 文件 kernel/common/drivers/staging/android/binder.c 中 。 


struct binder proc ( 
struct hlist node proc node; 
struct rb root threads; 
struct rb root nodes; 
struct rb root refs by desc; 
struct rb root refs by node; 
int pid; 
struct vm area struct *vma; 
struct task struct *tsk; 
struct files struct *files; 
struct hlist node deferred work node; 
int deferred work; 
void *buffer; 
ptrdiff t user buffer offset; 
struct list head buffers; 
struct rb root free buffers; 
struct rb root allocated buffers; 
Size t free async space; 
struct page **pages; 
Size t buffer size; 
uint32 t buffer free; 
struct list head todo; 
wait queue head t wait; 
struct binder stats stats; 
struct list head delivered death; 
int max threads; 
int requested threads; 
int requested threads started; 
int ready threads; 
long default priority; 
hi 
上 述 结构 体 的 成 员 比 较 多 ， 其 中 最 重要 的 有 4 个 成 员 变 量 。 
口 threads。 
口 nodes。 
口 refs by desc. 
口 refs by node. 
上 述 4 个 成 员 变量 都 是 表示 代码 中 算法 的 红 黑 树 的 节点 ， 也 就 是 说 ，binder proc 分 别 挂 在 
4 个 红 黑 树 下 ， 有 具体 说 明 如 下 。 
口 threads 树 : 用 来 保存 binder proc 进程 内 用 于 处 理 用 户 请 求 的 线程 ， 它 的 最 大 数量 由 
max threads 来 决定 。 
O node 树 : 用 来 保存 binder proc 进程 内 的 Binder 实体 。 
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口 refs by desc 树 和 refs_by_node 树 : 用 来 保存 binder proc 进程 内 的 Binder 引用 ， 即 引 
用 的 其 他 进程 的 Binder 实体 ， 它 分 别 用 两 种 方式 来 组 织 红 黑 树 ， 一 种 是 以 句柄 作 key 
值 来 组 织 ， 一 种 是 以 引用 的 实体 节点 的 地 址 值 作 key 值 来 组 织 ， 它 们 都 是 表示 同一 样 
东西 ， 只 不 过 是 为 了 内 部 查找 方便 而 用 两 个 红 黑 树 来 表示 。 
这 样 , 打开 设备 文件 /dev/binder 的 操作 就 完成 了 , 接 下 来 需要 对 打开 的 设备 文件 进行 内 存 映 
射 操作 mmap。 


bs-»mapped = mmap(NULL, mapsize, PROT READ, MAP PRIVATE, bs-»fd, 0); 
对 应 Binder 驱动 程序 的 是 函数 binder mmap0O， 实 现代 码 如 下 。 


Static int binder mmap(struct file *filp, struct vm area struct *vma) 
{ 
int ret; 
struct vm_struct *area; 
struct binder proc *proc = filp-»private data; 
const char *failure string; 
struct binder buffer *buffer; 
if ((vma-»vm end - vma->vm_start) > SZ 4M) 
vma-»vm end - vma-»vm start « SZ 4M; 
if (binder debug mask & BINDER DEBUG OPEN CLOSE) 
printk(KERN INFO 
"binder mmap: %d $1x-$1x (%ld K) vma $1x pagep %1x\n", 
proc-»pid, vma-»vm start, vma-»vm end, 
(vma-»vm end - vma-»vm start) / SZ 1K, vma-»vm flags, 
(unsigned long)pgprot val(vma-»vm page prot)); 
if (vma-»vm flags & FORBIDDEN MMAP FLAGS) ( 
ret - -EPERM; 
failure string - "bad vm flags"; 
goto err bad arg; 
) 


vma-»vm flags - (vma-»vm flags | VM DONTCOPY) & -VM MAYWRITE; 


if (proc-»buffer) { 
ret - -EBUSY; 
failure string - "already mapped"; 
goto err already mapped; 


area - get vm area(vma-»vm end - vma-»vm start, VM IOREMAP); 
if (area NULL) ( 

ret - -ENOMEM; 

failure string - "get vm area"; 

goto err get vm area failed; 


} 


proc->buffer = area->addr; 
proc-»user buffer offset = vma-»vm start - (uintptr_t)proc->buffer; 


#ifdef CONFIG CPU CACHE VIPT 
if (cache is vipt aliasing()) { 
while (CACHE COLOUR((vma-»vm start ^ (uint32 t)proc-»buffer))) { 
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printk(KERN INFO "binder mmap: %d $1x-$1x maps $p bad alignment n", 
proc-»pid, vma-»vm start, vma-»vm end, proc->buffer) ; 
vma-»vm start += PAGE SIZE; 
} 
} 


#endif 
proc-»pages = kzalloc (sizeof (proc->pages[0]) * ((vma->vm_end - vma-»vm start) 
/ PAGE_SIZE), GFP_KERNEL) ; 
if (proc->pages == NULL) { 
ret = -ENOMEM; 
failure_string = "alloc page array"; 
goto err_alloc_pages_failed; 


} 


proc->buffer_size = vma->vm_end - vma->vm_start; 


vma-»vm ops = &binder vm ops; 
vma-»vm private data - proc; 


if (binder update page range (proc, 1, proc->buffer, proc->buffer + PAGE SIZE, 
vma)) ( 
ret - -ENOMEM; 
failure string - "alloc small buf"; 
goto err alloc small buf failed; 
) 
buffer - proc-»buffer; 
INIT LIST HEAD(&proc-»buffers); 
list add(&buffer-»entry, &proc-»buffers); 
buffer-»free - 1; 
binder insert free buffer(proc, buffer); 
proc-»free async space = proc-»buffer size / 2; 
barrier(); 
proc->files = get files struct (current); 
proc-»vma - vma; 


/*printk(KERN INFO "binder mmap: %d %1x-%lx maps $pWn", proc->pid, 
vma-»vm start, vma-»vm end, proc-»buffer);*/ 
return 0; 


err alloc small buf failed: 
kfree(proc-»pages); 
proc-»pages - NULL; 
err alloc pages failed: 
vfree(proc-»buffer); 
proc-»buffer - NULL; 
err get vm area failed: 
err already mapped: 
err bad arg: 
printk(KERN ERR "binder mmap: %d %1x-%lx %s failed %d\n", proc-»pid, 
vma-»vm start, vma-»vm end, failure string, ret); 
return ret; 


} 
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在 上 述 函 数 binder mmap0O 中 , 首先 通过 filp-^private data 得 到 在 打开 设备 文件 “/dev/binder” 
时 创建 的 结构 binder proc。 内 存 映射 信息 放 在 vma 参数 中 。 读 者 需要 注意 ， 这 里 vma 的 数据 类 
型 是 结构 vm_area_struct， 表 示 的 是 一 块 连续 的 虚拟 地 址 空间 区 域 。 在 函数 变量 声明 的 地 方 ， 还 
看 到 有 一 个 类 似 的 结构 体 vm_struct， 这 个 数据 结构 也 是 表示 一 块 连续 的 虚拟 地 址 空间 区 域 。 那 
么 ， 这 两 者 的 区 别 是 什么 呢 ? 在 Linux 中 ,结构 体 vm area. struct 表示 的 虚拟 地 址 是 给 进程 使 用 
的 ， 而 结构 体 vm struct 表示 的 虚拟 地 址 是 给 内 核 使 用 的 ， 它 们 对 应 的 物理 页 面 都 可 以 是 不 连续 
的 。 结构 体 vm area struct 表示 的 地 址 空间 范围 是 O~3GB, 而 结构 体 vm struct 表示 的 地 址 空间 
范围 是 3GB+896MB+8MB) 一 4GB。 为 什么 结构 体 vm struct. 表示 的 地 址 空间 范围 不 是 3GB 一 
AGB We? 因为 3GB 一 (3GB+896MB) 范 围 的 地 址 是 用 来 映射 连续 的 物理 页 面 的 ， 这 个 范围 的 虚拟 
地 址 和 对 应 的 实际 物理 地 址 有 着 简单 的 对 应 关系 ， 即 对 应 0-896MB 的 物理 地 址 空间 ， 而 
(3GB+896MB) 一 GGB+896MB+8MB) 是 安全 保护 区 域 。 例如 所 有 指向 这 SMB 地 址 空间 的 指针 都 
非法 的 ， 所 以 结构 体 vm struct 使 用 3GB+896MB+8MB) 一 4GB 地 址 空间 来 映射 非 连续 的 物理 


=a m 


此 处 为 什么 会 同时 使 用 进程 虚拟 地 址 空间 和 内 核 虚拟 地 址 空间 来 映射 同一 个 物理 页 面 呢 ? 
这 就 是 Binder 进程 间 通 信 机 制 的 精 散 所 在 了 。 在 同一 个 物理 页 面 ， 一 方面 映射 到 进程 虚拟 地 址 
空间 ， 一 方面 映射 到 内 核 虚 拟 地 址 空间 ， 这 样 进程 和 内 核 之 间 就 可 以 减少 一 次 内 存 复 制 工作 ， 
提高 了 进程 之 间 的 通信 效率 。 

THET binder mmap 的 原理 后 ， 整 个 函数 的 逻辑 就 很 好 理解 了 。 但 是 在 此 还 是 先 要 解释 一 
下 binder proc 结构 体 中 的 如 下 成 员 变 量 。 
buffer: 是 一 个 void* 指 针 ， 表 示 要 映射 的 物理 内 存在 内 核 空间 中 的 起 始 位 置 。 
buffer size: 是 一 个 size t 类 型 的 变量 ， 表 示 要 映射 的 内 存 的 大 小 。 
pages: 是 一 个 struct page* 类 型 的 数组 ，struct page 是 用 来 描述 物理 页 面 的 数据 结构 ; 
user buffer offset: 是 一 个 ptrdiff t 类 型 的 变量 ， 表 示 的 是 内 核 使 用 的 虚拟 地 址 与 进程 
使 用 的 虚拟 地 址 之 间 的 差 值 ， 即 如 果 某 个 物理 页 面 在 内 核 空间 中 对 应 的 虚拟 地 址 是 
addr 的 话 ,那么 这 个 物理 页 面 在 进程 空间 对 应 的 虚拟 地 址 就 为 "addrruser_ buffer offset" 
格式 。 

接 下 来 还 需要 看 一 下 Binder 驱动 程序 管理 内 存 映 射 地 址 空间 的 方法 ， 即 如 何 管理 buffer ~ 
(buffer + buffer size) 这 段 地 址 空间 的 ， 这 个 地 址 空间 被 划分 为 一 段 一 段 来 管理 , 每 一 段 是 用 结构 
体 binder_buffer 来 描述 的 ， 代 码 如 下 。 
struct binder buffer { 

struct list head entry; /* free and allocated entries by addesss */ 

struct rb node rb node; /* free entry by size or allocated entry */ 

/* by address */ 

unsigned free : 1; 

unsigned allow user free : 1; 

unsigned async transaction : 1; 

unsigned debug id : 29; 

struct binder transaction *transaction; 

struct binder node *target node; 

size t data size; 

size t offsets size; 

uint8 t data[0]; 


oooo 
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每 一 个 binder buffer 都 通过 其 成 员 entry 按 从 低地 址 到 高 地 址 连 入 到 struct binder. proc 中 的 
buffers 表示 的 链表 中 去 ， 同 时 ， 每 一 个 binder buffer 又 可 分 为 正在 使 用 的 和 空闲 的 ， 通 过 free 


成 员 变量 来 


区 分 ， 空 闲 的 binder_ buffer 通过 成 员 变量 rb. node 的 帮助 ， 连 入 到 struct binder proc 


中 的 free buffers 表示 的 红 黑 树 中 去 。 而 那些 正在 使 用 的 binder_buffer， 通 过 成 员 变量 rb node 
连 入 到 binder proc 中 的 allocated. buffers 表示 的 红 黑 树 中 去 。 这 样 做 当然 是 为 了 方便 查询 和 维护 
这 块 地 址 空间 了 。 

然后 回 到 函数 binder mmapO。 首 先是 对 参数 作 一 些 检查 ， 例 如 要 映射 的 内 存 大 小 不 能 超过 
SIZE 4M， 即 4MB 。 在 来 到 文件 service managerc 中 的 main0 函 数 ， 这 里 传 进来 的 值 是 
128x1024B， 即 128KB， 对 参数 的 检查 没有 问题 。 通 过 检查 后 ， 调 用 函数 get_vm_area0 获 得 一 


个 空闲 的 vm_struct 


区 间 , 并 初始 化 proc 结构 体 的 buffer、user_ buffer offset. pages 和 buffer size 


等 成 员 变 量 ， 接 着 调用 binder update page range 为 虚拟 地 址 空间 proc->buffer ~ proc->buffer + 
PAGE SIZE 分 配 一 个 空闲 的 物理 页 面 ， 同 时 这 段 地 址 空间 使 用 一 个 binder buffer 来 描述 ， 分 别 
插入 到 proc->buffers 链表 和 proc->free_buffers 红 黑 树 中 去 ， 最 后 还 初始 化 了 proc 结构 体 的 
free async space. files 和 vma 三 个 成 员 变 量 。 


然后 继续 分 析 函 数 binder update page range). Æ— F Binder 驱动 程序 是 如 何 实现 把 一 个 


物理 页 


同时 映射 到 内 核 空间 和 进程 空间 去 的 。 


static int binder update page range(struct binder proc *proc, int allocate, 


{ 


void *start, void *end, struct vm_area_struct *vma) 


void *page addr; 
unsigned long user page addr; 
struct vm struct tmp area; 
struct page **page; 
struct mm struct *mm; 
if (binder debug mask & BINDER DEBUG BUFFER ALLOC) 
printk(KERN INFO "binder: %d: %s pages %p-%p\n", 
proc-»pid, allocate ? "allocate" : "free", start, end); 
if (end «- start) 
return 0; 
if (vma) 
mm - NULL; 
else 
mm = get task mm(proc-»tsk); 
if (mm) { 
down write(&mm-»mmap sem); 
vma - proc-»vma; 
} 
if (allocate == 0) 
goto free_range; 
if (vma == NULL) { 
printk(KERN ERR "binder: %d: binder alloc buf failed to " 
"map pages in userspace, no vma\n", proc-»pid); 
goto err no vma; 
} 
for (page_addr = start; page_addr < end; page_addr += PAGE_SIZE) { 
int ret; 
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} 


struct page **page array ptr; 
page = &proc-»pages[(page addr - proc->buffer) / PAGE SIZE]; 
BUG ON(*page); 
*page = alloc page(GFP KERNEL |  GFP ZERO); 
if (*page -- NULL) ( 
printk(KERN ERR "binder: $d: binder alloc buf failed " 
"for page at %p\n", proc-»pid, page addr); 
goto err alloc page failed; 
} 
tmp_area.addr = page_addr; 
tmp area.size = PAGE SIZE + PAGE SIZE /* guard page? */; 
page array ptr - page; 
ret - map vm area(&tmp area, PAGE KERNEL, &page array ptr); 
if (ret) { 
printk(KERN ERR "binder: $d: binder alloc buf failed " 
"to map page at $p in kernel\n", 
proc-»pid, page addr); 
goto err map kernel failed; 
} 
user_page_addr = 
(uintptr t)page addr + proc-»user buffer offset; 
ret = vm insert page(vma, user page addr, page[0]); 
if (ret) ( 
printk(KERN ERR "binder: $d: binder alloc buf failed " 
"to map page at %lx in userspace\n", 
proc-»pid, user page addr); 
goto err vm insert page failed; 


} 


/* vm_insert_page does not seem to increment the refcount */ 


if (mm) { 


} 


up_write (&mm->mmap_sem) ; 
mmput (mm) ; 


return 0; 
free range: 
for (page addr - end - PAGE SIZE; page addr »- start; 


page addr -= PAGE SIZE) { 
page - &proc-»pages[(page addr - proc-»buffer) / PAGE SIZE]; 
if (vma) 
zap page range(vma, (uintptr t)page addr + 
proc-»user buffer offset, PAGE SIZE, NULL); 


err vm insert page failed: 


unmap kernel range((unsigned long)page addr, PAGE SIZE); 


err map kernel failed: 


. free page(*page); 
*page - NULL; 


err alloc page failed: 
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up write(&mm-»mmap sem); 
mmput (mm) ; 
} 


return -ENOMEM; 


} 


通过 上 述 函 数 不 但 可 以 分 配 物理 页 面 ,而 且 可 以 用 来 释放 物理 页 面 ,这 可 以 通过 参数 allocate 
来 区 别 , 在 此 我 们 只 需 关 注 分 配 物理 页 面 的 情况 。 要 分 配 物理 页 面 的 虚拟 地 址 空间 范围 为 (start ~ 
end)， 函 数 前 面 的 一 些 检查 多 辑 就 不 看 了 ， 我 们 只 需 直接 看 中 间 的 for 循环 。 


for (page addr = start; page addr < end; page addr += PAGE SIZE) { 
int ret; 
struct page **page array ptr; 
page = &proc-»pages[(page addr - proc->buffer) / PAGE SIZE]; 
BUG ON(*page); 
*page = alloc page(GFP KERNEL | _ GFP ZERO); 
if (*page -- NULL) { 
printk(KERN ERR "binder: $d: binder alloc buf failed " 
"for page at %p\n", proc-»pid, page addr); 
goto err alloc page failed; 


} 
tmp area.addr = page addr; 
tmp area.size - PAGE SIZE « PAGE SIZE /* guard page? */; 
page array ptr - page; 
ret - map vm area(&tmp area, PAGE KERNEL, &page array ptr); 
if (ret) { 
printk(KERN ERR "binder: $d: binder alloc buf failed " 
"to map page at %p in kernel\n", 
proc-»pid, page addr); 
goto err map kernel failed; 
) 
user page addr - 
(uintptr t)page addr + proc-»user buffer offset; 
ret = vm insert page(vma, user page addr, page[0]); 
if (ret) { 
printk(KERN ERR "binder: %d: binder alloc buf failed " 
"to map page at $1x in userspace\n", 
proc-»pid, user page addr); 
goto err vm insert page failed; 


} 


/* vm_insert_page does not seem to increment the refcount */ 
} 

在 上 述 代 码 中 ， 首 先 调用 函数 alloc_ page0 分 配 一 个 物理 页 面 ， 此 函数 返回 一 个 结构 体 page 
物理 页 面 描述 符 ， 根 据 这 个 描述 的 内 容 初始 化 好 结构 体 vm struct tmp_area， 然 后 通过 
map vm area 将 这 个 物理 页 面 插入 到 tmp. area 描述 的 内 核 空间 去 ， 接 着 通过 page addr + proc-> 
user buffer offset 获得 进程 虚拟 空间 地 址 ， 并 通过 函数 vm insert page(O 将 这 个 物理 页 面 插入 到 
进程 地 址 空间 去 ， 参 数 vma 表示 要 插入 的 进程 的 地 址 空间 。 

我 们 再 次 回 到 文件 fr ameworks/base/cmds/servicemanager/service_manager.c 中 的 main PR Zt, 
接 下 来 需要 调用 binder become context manager 来 通知 Binder 驱动 程序 自己 是 Binder 机 制 的 上 
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下 文 管理 者 , 即 守护 进程 .函数 binder become context manager0 位 于 文件 frameworks/base/cmds/ 
servicemanager/binder.c 中 ， 具 体 代码 如 下 。 


int binder become context manager(struct binder state *bs){ 
return ioct1(bs->fd, BINDER SET CONTEXT MGR, 0); 


) 
在 此 通过 调用 ioctl 文件 操作 函数 通知 Binder 驱动 程序 自己 是 守护 进程 ， 命 令 号 是 
BINDER SET CONTEXT MGR, 并 没有 任何 参数 。BINDER_SET_ CONTEXT MGR 定义 如 下 。 


#define BINDER SET CONTEXT MGR  IOW('b', 7, int) 


这 样 就 进入 到 Binder 驱动 程序 的 函数 binder ioctl0)， 在 此 只 关注 如 下 BINDER SET - 
CONTEXT MGR 命令 即 可 : 


static long binder ioctl(struct file *filp, unsigned int cmd, unsigned long arg) 
{ 

int ret; 

struct binder proc *proc = filp-»private data; 

struct binder thread *thread; 

unsigned int size =  IOC SIZE (cmd); 

void _ user *ubuf = (void _ user *)arg; 

/*printk(KERN INFO "binder ioctl: %d:%d $x $1xMn", proc-»pid, current-»pid, 


cmd, arg);*/ 

ret = wait event interruptible(binder user error wait, 
binder stop on user error « 2); 

if (ret) 


return ret; 
mutex lock(&binder lock); 
thread - binder get thread(proc); 


if (thread -- NULL) { 
ret - -ENOMEM; 
goto err; 


) 
switch (cmd) { 
case BINDER SET CONTEXT MGR: 
if (binder context mgr node !- NULL) ( 
printk(KERN ERR "binder: BINDER SET CONTEXT MGR already set\n"); 
ret - -EBUSY; 


goto err; 
) 
if (binder context mgr uid !- -1) { 
if (binder context mgr uid !- current-»cred-»euid) { 
printk(KERN ERR "binder: BINDER SET " 
"CONTEXT MGR bad uid %d !- %d\n", 
current-»cred-»euid, 
binder context mgr uid); 
ret - -EPERM; 
goto err; 
} 
} else 


binder_context_mgr_uid = current->cred->euid; 
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binder context mgr node = binder new node(proc, NULL, NULL); 
if (binder context mgr node == NULL) { 
ret = -ENOMEM; 
goto err; 
} 
binder context mgr node->local weak refs++; 
binder context mgr node-»local strong refs++; 
binder context mgr node-»has strong ref = 1; 
binder context mgr node-»has weak ref - 1; 
break; 
default: 
ret - -EINVAL; 
goto err; 
} 
ret = 0; 
erT: 
if (thread) 
thread->looper &= ~BINDER_LOOPER_STATE_NEED_RETURN; 
mutex unlock(&binder lock); 
wait event interruptible(binder user error wait, 
binder stop on user error « 2); 
if (ret && ret !- -ERESTARTSYS) 
printk(KERN INFO "binder: %d:%d ioctl $x $1x returned %d\n", proc-»pid, 
current-»pid, cmd, arg, ret); 
return ret; 
} 


在 分 析 函 数 binder_ioctl0 前 ， 需 要 先 弄 明白 如 下 两 个 数据 结构 。 
(1) 结构 体 binder thread: 表示 一 个 线程 ， 这 里 就 是 执行 binder become context manager() 
函数 的 线程 。 


struct binder thread { 

struct binder proc *proc; 

struct rb node rb node; 

int pid; 

int looper; 

struct binder transaction *transaction stack; 

struct list head todo; 

uint32 t return error; /* Write failed, return error code in read buf */ 

uint32 t return error2; /* Write failed, return error code in read */ 
/* buffer. Used when sending a reply to a dead process that */ 
/* we are also waiting on */ 

wait queue head t wait; 

struct binder stats stats; 


ys 

在 上 述 结构 体 中 , proc 表示 是 这 个 线程 所 属 的 进程 。 结构 体 binder_proc 中 , 成 员 变量 thread 
的 类 型 是 tb_root， 表 示 一 棵 红 黑 树 ， 把 属于 这 个 进程 的 所 有 线程 都 组 织 起 来 ， 结 构 体 
binder thread 的 成 员 变 量 rb. node 就 是 用 来 链 入 这 棵 红 黑 树 的 节点 了 。looper 成 员 变量 表示 线程 
的 状态 ， 它 可 以 取 下 面 的 值 。 


«qp 


enum { 
BINDER LOOPER STATE REGISTERED 0x01, 
BINDER_LOOPER_STATE_ENTERED 0x02, 


BINDER LOOPER STATE INVALID 0x08, 
BINDER LOOPER STATE WAITING 0x10, 
BINDER LOOPER STATE NEED RETURN = 0x20 


BINDER LOOPER STATE EXITED = 0x04, 


h 

至 于 其 余 的 成 员 变 量 ，transaction_stack 表示 线程 正在 处 理 的 事务 ，todo 表示 发 往 该 线程 的 
HEINZ, return error 和 return. error2 表示 操作 结果 返回 码 ，wait 用 来 阻塞 线程 等 待 某 个 事件 
的 发 生 ，stats 用 来 保存 一 些 统计 信息 。 这 些 成 员 变 量 遇 到 的 时 候 再 分 析 它 们 的 作用 。 

(2) 数据 结构 binder_node: 表示 一 个 binder 实体 ， 定 义 如 下 。 


struct binder node { 
int debug id; 
struct binder work work; 
union { 
struct rb node rb node; 
struct hlist node dead node; 
}; 
struct binder proc *proc; 
struct hlist head refs; 
int internal strong refs; 
int local weak refs; 
int local strong refs; 
void _ user *ptr; 
void _ user *cookie; 
unsigned has strong ref : 1; 
unsigned pending strong ref : 1; 
unsigned has weak ref : 1; 
unsigned pending weak ref : 1; 
unsigned has async transaction : 1; 
unsigned accept fds : 1; 
int min priority : 8; 
struct list head async todo; 
hi 
由 此 可 见 ，rb_node 和 dead node 组 成 了 一 个 联合 体 ， 具 体 来 说 分 为 如 下 两 种 情形 。 
O WRS Binder 实体 还 在 正常 使 用 ， 则 使 用 rb node 来 连 入 “proc->nodes” 所 表示 的 
红 黑 树 的 节点 ， 这 棵 红 黑 树 用 来 组 织 属于 这 个 进程 的 所 有 Binder 实体 ; 
O WRS Binder 实体 所 属 的 进程 已 经 销毁 ， 而 这 个 Binder 实体 又 被 其 他 进程 所 引用 ， 
则 这 个 Binder 实体 通过 dead node 进入 到 一 个 哈 希 表 中 去 存放 。proc 成 员 变量 就 是 表 
示 这 个 Binder 实例 所 属于 进程 了 。 
refs 成 员 变 量 把 所 有 引用 了 该 Binder 实体 的 Binder 引用 连接 起 来 构成 一 个 链表 。intemal_ 
strong refs, local weak refs 和 local strong refs 表示 这 个 Binder 实体 的 引用 计数 。ptr 和 cookie 
成 员 变量 分 别 表示 这 个 Binder 实体 在 用 户 空间 的 地 址 以 及 附加 数据 。 其 余 的 成 员 变 量 就 不 描述 
了 ， 遇 到 的 时 候 再 分 析 。 
接 下 来 回 到 函数 binder ioctlt0 中 ， 首 先是 通过 “filp->private_data” 获 得 proc 变量 ， 此 处 的 
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e 
函数 binder mmap0 是 一 样 的 ， 然 后 通过 函数 binder get thread0 获 得 线程 信息 ， 此 函数 的 代码 
如 下 。 


static struct binder thread *binder get _ thread (struct binder proc *proc) 


{ 


struct binder thread *thread = NULL; 
struct rb node *parent = NULL; 
struct rb node **p = &proc-»threads.rb node; 


while (*p) { 
parent - *p; 
thread rb entry(parent, struct binder thread, rb node); 


if (current-»pid « thread-»pid) 
p = &(*p)-»rb left; 
else if (current-»pid » thread-»pid) 
p = &(*p)-»rb right; 
else 
break; 
) 
if (*p -- NULL) ( 
thread - kzalloc(sizeof(*thread), GFP KERNEL); 
if (thread -- NULL) 
return NULL; 
binder_stats.obj_created[BINDER_STAT_THREAD] ++; 
thread->proc = proc; 
thread->pid = current->pid; 
init waitqueue head(&thread-»wait); 
INIT LIST HEAD (&thread->todo) ; 
rb link node(&thread-»rb node, parent, p); 
rb insert color(&thread-»rb node, &proc-»threads); 
thread-»looper |- BINDER LOOPER STATE NEED RETURN; 
thread-»return error - BR OK; 
thread-»return error2 - BR OK; 
) 


return thread; 

j; 

在 上 述 代 码 中 ， 把 当前 线程 current 的 pid 作为 键 值 ， 在 进程 proc->threads 表示 的 红 黑 树 中 
进行 查找 ， 看 是 否 已 经 为 当前 线程 创建 过 了 binder thread 信息 。 在 这 个 场景 下 ， 由 于 当前 线程 是 
第 一 次 进 到 这 里 ， 所 以 肯定 找 不 到 ， 即 *p 一 NULL 成 立 ， 于 是 ， 就 为 当前 线程 创建 一 个 线程 上 
下 文 信息 结构 体 binder_thread， 并 初始 化 相应 成 员 变 量 ， 并 插入 到 proc->threads 所 表示 的 红 黑 
树 中 去 , 下 次 要 使 用 时 就 可 以 从 proc 中 找到 了 。 注 意 , 这 里 的 thread->looper = BINDER_LOOPER_ 
STATE NEED RETURN。 

再 回 到 函数 binder ioctl0 中 ， 接 下 来 会 有 两 个 全 局 变量 binder context mgr node 和 
binder context mgr uid， 定 义 如 下 。 


static struct binder node *binder context mgr node; 
static uid t binder context mgr uid - -1; 


其 中 binder context mgr node 用 来 表示 Service Manager 3/4, binder context mgr uid 表示 
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Service Manager 守护 进程 的 uid。 在 这 个 场景 下 ， 由 于 当前 线程 是 第 一 次 进 到 这 里 ， 所 以 
binder context mgr node 为 NULL, binder context mgr uid 为 -1， 于 是 初始 化 binder_context_ 
mgr uid 为 current->cred->euid， 这 样 当 前 线程 就 成 为 Binder 机 制 的 守护 进程 了 ， 并 且 通 过 
binder new_node 为 Service Manager 创建 Binder 实体 。 


D> 


static struct binder_node * 
binder new node(struct binder proc *proc, void user *ptr, void user *cookie) 


{ 


} 


struct rb node **p = &proc-»nodes.rb node; 
struct rb node *parent - NULL; 
struct binder node *node; 
while (*p) ( 
parent - *p; 
node - rb entry(parent, struct binder node, rb node); 
if (ptr « node-»ptr) 
p = &(*p)-»rb left; 
else if (ptr » node-»ptr) 
p = &(*p)-»rb right; 
else 
return NULL; 
} 
node = kzalloc(sizeof(*node), GFP KERNEL); 
if (node -- NULL) 
return NULL; 
binder stats.obj created[BINDER STAT NODE]++; 
rb link node(&node-»rb node, parent, p); 
rb insert color(&node-»rb node, &proc-»nodes); 
node-»debug id = ««binder last id; 
node-»proc - proc; 
node-»ptr - ptr; 
node-»cookie - cookie; 
node->work.type = BINDER WORK NODE; 
INIT LIST HEAD(&node-»work.entry); 
INIT LIST HEAD(&node-»async todo); 
if (binder debug mask & BINDER DEBUG INTERNAL REFS) 
printk(KERN INFO "binder: %d:%d node %d u$p c%p created\n", 
proc-»pid, current-»pid, node-»debug id, 
node-»ptr, node-»cookie); 
return node; 


在 这 里 传 进来 的 ptr 和 cookie 的 值 都 为 NULL。 上 述 函数 会 首先 检查 proc->nodes 红 黑 树 中 
是 否 已 经 存在 以 ptr 为 键 值 的 node， 如 果 已 经 存在 则 返回 NULL. 在 这 个 场景 下 ， 由 于 当前 线程 
是 第 一 次 进入 到 这 里 ， 所 以 肯定 不 存在 ， 于 是 就 新 建 了 一 个 ptr 73 NULL 的 binder node， 并 且 
初始 化 其 他 成 员 变 量 ， 并 插入 到 proc->nodes 红 黑 树 中 去 。 

当 binder new node 返回 到 函数 binder ioctlO 后 ,会 把 新 建 的 binder_node 指针 保存 在 binder_ 
context mgr node 中 ， 然 后 又 初始 化 binder context mgr node 的 引用 计数 值 。 这 样 执行 
BINDER SET CONTEXT MGR 命令 完毕 ， 在 函数 binder ioctl0 返 回 前 执行 下 面 的 语句 。 


if (thread) 
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thread->looper &= ~BINDER LOOPER STATE NEED RETURN; 


在 执行 binder_get_thread H}, thread->looper = BINDER LOOPER STATE NEED RETURN, 
执行 了 这 条 语句 后 ，thread->looper = 0. 

再 次 回 到 文件 frameworks/base/cmds/servicemanager/service manager.c 中 的 main0 函 数 ， 接 
下 来 需要 调用 函数 binder loop0 进 入 循环 ， 等 待 客户 端 发 送 请 求 。 函 数 binder loop0 定 义 在 文件 
frameworks/base/cmds/servicemanager/binder.c 中 。 


void binder loop (struct binder state *bs, binder handler func) 
{ 

int res; 

struct binder write read bwr; 

unsigned readbuf [32]; 

bwr.write size - 0; 

bwr.write consumed - 0; 

bwr.write buffer - 0; 


readbuf[0] - BC ENTER LOOPER; 
binder write(bs, readbuf, sizeof (unsigned)); 
for (;;) { 
bwr.read_size = sizeof (readbuf) ; 
bwr.read_consumed = 0; 
bwr.read_buffer = (unsigned) readbuf; 
res = ioctl(bs->fd, BINDER WRITE READ, &bwr) ; 
if (res < 0) { 
LOGE("binder loop: ioctl failed (%s)\n", strerror(errno) ) ; 
break; 
} 
res = binder parse(bs, 0, readbuf, bwr.read_consumed, func); 
if (res == 0) { 
LOGE("binder_loop: unexpected reply?!\n") ; 
break; 
} 
if (res < 0) { 
LOGE("binder loop: io error $d %s\n", res, strerror(errno) ) ; 
break; 


} 

在 上 述 代 码 中 ， 首 先 通过 函数 binder_write0 执 行 BC ENTER LOOPER 命令 以 告诉 Binder 
驱动 程序 ，Service Manager 马上 要 进入 循环 。 在 此 还 需要 理解 设备 文件 “/dev/binder” 操 作 函 数 
ioctl 的 操作 码 BINDER_WRITE_READ， 首 先 看 其 定义 。 

#define BINDER WRITE READ _IOWR('b', 1, struct binder write read) 

此 io 操作 码 有 一 个 形式 为 struct binder write read 的 参数 : 


struct binder write read { 
signed long write size; /* bytes to write */ 
signed long write consumed; /* bytes consumed by driver */ 
unsigned long write buffer; 
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Signed long read size; /* bytes to read */ 
Signed long read consumed; /* bytes consumed by driver */ 
unsigned long read buffer; 


}; 


用 户 空 间 程序 和 Binder 驱动 程序 交互 时 ， 大 多 数 是 通过 BINDER_WRITE READ 命令 实现 
的 ，write_ bufffer 和 read buffer 所 指向 的 数据 结构 还 指定 了 具体 要 执行 的 操作 ，write_bufffer 和 
read buffer 所 指向 的 结构 体 是 binder_transaction_data， 定 义 此 结构 体 的 代码 如 下 : 


struct binder transaction data { 

/* The first two are only used for bcTRANSACTION and brTRANSACTION, 

* identifying the target and contents of the transaction. 

union { 
size t handle; /* target descriptor of command transaction */ 
void *ptr; /* target descriptor of return transaction */ 

) target; 

void *cookie; /* target object cookie */ 

unsigned int code; /* transaction command */ 


/* General information about the transaction. */ 
unsigned int flags; 


pid t sender pid; 

uid t sender euid; 

size t data size; /* number of bytes of data */ 

size t offsets size; /* number of bytes of offsets */ 


/* If this transaction is inline, the data immediately 
* follows here; otherwise, it ends with a pointer to 
* the data buffer. 

c 
union { 
struct { 
/* transaction data */ 
const void *buffer; 
/* offsets from buffer to flat binder object structs */ 
const void *offsets; 
} ptr; 
uint8 t buf[8]; 
) data; 


) 

到 此 为 止 ， 我们 从 源 代码 一 步 一 步 地 分 析 完 Service Manager 是 如 何 成 为 Android 进程 间 通 
信 QPC) 机 制 Binder 守护 进程 的 了 。 在 接 下 来 的 内 容 中 ， 简 要 总 结 Service Manager 成 为 Android 
进程 间 通 信 (IPC) 机 制 Binder 守护 进程 的 过 程 。 

(1) 打开 /dev/binder 文件 。 

open("/dev/binder", O RDWR); 

(2) 建立 128KB 的 内 存 映 射 。 


mmap(NULL, mapsize, PROT READ, MAP PRIVATE, bs-»fd, 0); 
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(3) 通知 Binder 驱动 程序 其 是 守护 进程 。 
binder become context manager (bs); 
(4) 进入 循环 等 待 请 求 的 到 来 。 

binder loop(bs, svcmgr handler); 


在 这 个 过 程 中 ， 在 Binder 驱动 程序 中 建立 了 一 个 struct binder proc 结构 、 一 个 struct 
binder thread 结构 和 一 个 struct binder node 结构 ,， 这样，Service Manager 就 在 Android 系统 的 进 
程 间 通信 机 制 Binder 担负 起 守护 进程 的 职责 了 。 


10.3.3 分析 Server 和 Client 获得 Service Manager 的 过 程 


作为 守护 进程 ，Service Manager 的 职责 是 为 服务 器 和 客户 端 服务 。 那 么 ， 服 务 器 和 客户 端 
如 何 获得 Service Manager 接口 ， 进 而 享受 它 提 供 的 服务 呢 ? 在 接 下 来 的 内 容 中 ， 将 和 大 家 一 起 
分 析 服 务 器 和 客户 端 获得 Service Manager 的 过 程 。 

众所周知 ，Service Manager 在 Binder 机 制 中 既 充当 守护 进程 的 角色 ， 同 时 它 也 充当 着 服务 
器 的 角色 ， 但 是 它 又 与 一 般 的 服务 器 不 一 样 。 对 于 普通 的 服务 器 来 说 ， 客 户 端 如 果 想 要 获得 服 
务 器 的 远程 接口 ， 必 须 通过 Service Manager 远程 接口 提供 的 getService 接口 来 获得 ， 这 本 身 就 
是 一 个 使 用 Binder 机 制 来 进行 进程 间 通 信 的 过 程 。 而 对 于 Service Manager 这 个 服务 器 来 说 ， 客 
户 端 如 果 想 要 获得 Service Manager 远程 接口 ， 却 不 必 通 过 进程 间 通 信 机 制 来 获得 ， 因 为 Service 
Manager 远程 接口 是 一 个 特殊 的 Binder 引用 ， 它 的 引用 句柄 一 定 是 0。 

获取 Service Manager 远程 接口 的 函数 是 defaultServiceManager()， 此 函数 声明 在 文件 
frameworks/base/include/binder/IServiceManager.h 中 ， 代 码 如 下 。 


sp<IServiceManager> defaultServiceManager(); 


函数 defaultServiceManager() 在 frameworks/base/libs/binder/IServiceManager.cpp 文件 中 实现 。 


sp<IServiceManager> defaultServiceManager() 


{ 


if (gDefaultServiceManager != NULL) return gDefaultServiceManager; 


{ 
AutoMutex _1(gDefaultServiceManagerLock) ; 
if (gDefaultServiceManager == NULL) { 
gDefaultServiceManager = interface cast«IServiceManager»( 
ProcessState::self()-»getContextObject (NULL)); 
} 
} 
return gDefaultServiceManager; 


} 


其 中 gDefaultServiceManagerLock 和 gDefaultServiceManager 是 全 局 变量 ， 定 义 在 文件 
frameworks/base/libs/binder/Static.cpp 中 : 


Mutex gDefaultServiceManagerLock; 
sp<IServiceManager> gDefaultServiceManager; 


从 上 述 函数 可 以 看 出 ，gDefaultServiceManager 是 单 例 模式 ， 在 调用 函数 defaultServiceManager() 
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时 , 如 果 已 经 创建 gDefaultServiceManager, 则 直接 返回 , 否则 通过 interface_cast<IServiceManager> 
(ProcessState::self()->getContextObject(NULL)) 来 创建 一 个 ， 并 保存 在 gDefaultServiceManager 全 
局 变量 中 。 

在 Binder 机 制 中 , 类 BpServiceManager 继承 了 类 BpInterface<IServiceManager>, BpInterface 
是 一 个 模板 类 ， 定 义 在 文件 frameworks/base/include/binder/TInterface.h 中 。 

template<typename INTERFACE> 

class BpInterface : public INTERFACE, public BpRefBase { 

public: 

BpInterface(const sp<IBinder>& remote); 
protected: 
virtual IBinder* onAsBinder(); 

h 

类 IServiceManager 继承 了 类 Interface, MÆ Interface 和 类 BpRefBase 又 分 别 继承 了 类 
RefBase。 在 类 BpRefBase 中 有 一 个 名 为 mRemote 的 成 员 变 量 ， 它 的 类 型 是 IBinder* ， 实 现 类 为 
BpBinder， 表 示 一 个 Binder 引用 ， 引 用 句柄 值 保存 在 BpBinder 类 的 mHandle 成 员 变量 中 。 类 
BpBinder 通过 类 IPCThreadState 来 和 Binder 驱动 程序 并 互 ， 而 IPCThreadState 又 通过 它 的 成 员 
变量 mProcess 来 打开 /dev/binder 设备 文件 ,mProcess 成 员 变 量 的 类 型 为 ProcessState。ProcessState 
类 打开 设备 /dev/binder 之 后 ， 将 打开 文件 描述 符 保存 在 mDriverFD 成 员 变量 中 ， 以 供 后 续 使 用 。 

在 理解 了 上 述 概念 后 ， 接 下 来 就 可 以 继续 分 析 创 建 Service Manager 远程 接口 的 过 程 了 ， 我 
们 的 最 终 目 的 是 要 创建 一 个 BpServiceManager 实例 ,并 且 返 回 它 的 IServiceManager 接口 。 下 面 
是 创建 Service Manager 远程 接口 的 主要 语句 。 

gDefaultServiceManager = interface cast«IServiceManager»( 
ProcessState::self()-»getContextObject (NULL)); 


上 述 代码 虽然 看 似 简短 ， 但 是 暗藏 玄机 。 首 先是 调用 函数 ProcessState::self0， 函 数 self At 
ProcessState 的 静态 成 员 函 数 ， 其 作用 是 返回 一 个 全 局 唯一 的 ProcessState 实例 变量 , 这 就 是 单 
例 模 式 ， 这 个 变量 名 为 gProcess。 如 果 尚 未 创建 gProcess， 就 会 执行 创建 操作 ， 在 ProcessState 
的 构造 函数 中 ， 会 通过 文件 操作 函数 open0 打 开设 备 文件 “/dewbinder”， 并 且 返 回来 的 设备 文 
件 描述 符 保存 在 成 员 变量 mDriverFD 中 。 

接着 调用 函数 gProcess->getContextObijectO 获 得 一 个 句柄 值 为 0 的 Binder 引 用 , 即 BpBinder， 
于 是 创建 Service Manager 远程 接口 的 语句 可 以 简化 为 下 面 的 形式 。 


gDefaultServiceManager = interface_cast<IServiceManager>(new BpBinder(0)); 


再 来 看 函数 interface _cast<IServiceManager> 的 具体 实现 ， 这 是 一 个 模板 函数 ， 定 义 在 文件 
framework/base/include/binder/TInterface.h 中 。 


template<typename INTERFACE> 

inline sp<INTERFACE> interface cast(const sp<IBinder>& obj) { 
return INTERFACE: :asInterface (obj); 

} 


这 里 的 INTERFACE 是 IServiceManager， 调 用 了 函数 [ServiceManager::asInterface(). PAA 
IServiceManager::asInterface() Jii: DECLARE META_INTERFACE(ServiceManagenD 宏 在 类 
IServiceManager 中 声明 的 ， 它 位 于 文件 framework/base/include/binder/IServiceManager.h 中 。 


> 
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DECLARE META INTERFACE (ServiceManager) ; 
展开 后 显示 为 : 


#define DECLARE META INTERFACE (ServiceManager) N 


Static const android::Stringl6 descriptor; N 
Static androi sp<IServiceManager> asInterface( X 
const android ipeandroid::IBinder»& obj); N 
virtual const android::Stringl6& getInterfaceDescriptor() const; N 
IServiceManager(); x 
virtual ~IServiceManager () ; 


IServiceManager::asInterface 的 实现 是 通过 宏 IMPLEMENT META INTERFACE (ServiceManager, 
"android.os.IServiceManager") 定 义 的 , 它 位 于 文件 framework/base/libs/binder/IServiceManager.cpp 中 。 


IMPLEMENT_META_INTERFACE (ServiceManager， "android.os.IServiceManager"); 
展开 后 的 代码 如 下 。 


##define IMPLEMENT META_INTERFACE(ServiceManager, "android.os.IServiceManager") 


\ 


const android: :String16 


IServiceManager: :descriptor ("android.os.IServiceManager") ; 


const android: :Stringl6é& 
IServiceManager: :get InterfaceDescriptor () { 


const 


return IServiceManager: :descriptor; 

} 

android: :sp<IServiceManager> IServiceManager: :asInterface ( 
const android: :sp<android::IBinder>& obj) 
{ 

android: :sp<IServiceManager> intr; 

if (obj != NULL) { 

intr = static_cast<IServiceManager*> ( 

obj - >queryLocalInterface ( 
IServiceManager: :descriptor) .get()); 

if (intr == NULL) { 

intr = new BpServiceManager (obj) ; 

} 

} 

return intr; 

} 

IServiceManager: :IServiceManager() { } 
IServiceManager: :~IServiceManager() { } 


IServiceManager: :asInterface 的 具体 实现 如 下 : 
android: :sp<IServiceManager> IServiceManager: :asInterface (const 
android::sp«android::IBinder»& obj) 


{ 


android: :sp<IServiceManager> intr; 
if (obj != NULL) { 
intr = static_cast<IServiceManager* > ( 


obj ->queryLocal Interface (IServiceManager: :descriptor) .get () ) ; 


if (intr == NULL) { 


«e 
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intr = new BpServiceManager (obj); 
} 
} 
return intr; 
j 
此 处 传 进来 的 参数 obj 就 是 刚才 创建 的 new BpBinder(0)， 类 BpBinder 中 的 成 员 函 数 
queryLocalInterface0 继 承 自 基 类 JBinder， 函 数 IBinder:queryLocalInterface0 位 于 文件 framework/base/ 
libs/binder/Binder.cpp 中 。 
sp<IInterface> IBinder::queryLocalInterface(const Stringl6& descriptor) 


{ 


return NULL; 
} 
由 此 可 见 ， 在 函数 IServiceManager::asInterface() 中 会 调用 下 面 的 语句 : 
intr = new BpServiceManager (obj); 
即 
intr = new BpServiceManager (new BpBinder(0)); 
EIF] defaultServiceManager0 函 数 中 ， 最 终结 果 如 下 。 
gDefaultServiceManager = new BpServiceManager (new BpBinder (0)); 


这 样 ， 创 建 Service Manager 远程 接口 完毕 ， 它 本 质 上 是 一 个 BpServiceManager， 包 含 了 一 
个 句柄 值 为 0 的 Binder 引用 。 

在 Android 系统 的 Binder 机 制 中 ， 服 务 器 和 客户 端 拿 到 这 个 Service Manager 远程 接口 后 怎 
么 用 呢 ? 具体 说 明 如 下 。 

(1) 对 于 服务 器 来 说 , 就 是 调用 接口 IServiceManager::addService 和 Binder 驱动 程序 进行 交 
H., 即 调用 BpServiceManager::addService 。 而 BpServiceManager::addService 又 会 调用 通过 其 基 
类 BpRefBase 的 成 员 函 数 remote0 获 得 原先 创建 的 BpBinder 实例 ， 接 着 调用 成 员 函 数 
BpBinder::transactO。 在 函数 BpBinder::transact0 中 , 又 会 调用 成 员 函 数 IPCThreadState::transact0， 
这 里 就 是 最 终 与 Binder 驱动 程序 交互 的 地 方 了 。 回 忆 一 下 前 面 的 类 图 ，IPCThreadState 有 一 个 
PorcessState 类 型 的 成 中 变量 mProcess， 而 mProcess 有 一 个 成 员 变 量 mDriverFD, 它 是 设备 文件 
/dev/binder 的 打开 文件 描述 符 ， 所 以 IPCThreadstate 相当 于 间接 地 在 拥有 了 设备 文件 

“/dev/binder” 的 打开 文件 描述 符 ， 于 是 便 可 以 与 Binder 驱动 程序 进行 交互 。 

(2) 对 于 客户 端 来 说 ， 就 是 调用 IServiceManager::getService 这 个 接口 来 和 Binder 驱动 程序 

交互 了 。 具 体 过 程 跟 上 述 服务 器 使 用 Service Manager 的 方法 一 样 的 ， 在 此 不 再 介绍 。 
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JNI 是 Java Native Interface 标准 的 缩写 ， 是 Java 平台 的 一 部 分 。JNI 是 本 地 编程 接口 ， 它 使 
得 在 Java 虚拟 机 内 部 运行 的 Java 代码 能 够 与 用 其 他 编程 语言 如 C、C++ 和 汇编 语言 ) 编 写 的 应 
用 程序 和 库 进 行 交 互 操 作 。 本 章 将 详细 讲解 JNI 接口 的 基本 知识 ， 为 读者 步 入 本 书后 面 知识 的 
学 习 打 下 基础 。 


11.1. JNI 技术 基础 


本 节 将 首先 讲解 TNI 技术 的 基础 知识 ， 为 读者 步 入 本 书后 面 知识 的 学 习 打 下 基础 。 


11.1.1. JNI 概述 


由 于 Android 的 应 用 层 的 类 都 是 以 Java 代码 编写 的 , 这 些 Java 类 编译 为 Dex 型 式 的 Bytecode 
后 ， 必 须 靠 Dalvik 虚拟 机 来 执行 。 虚 拟 机 在 Android 平台 中 扮演 着 很 重要 的 角色 。 

此 外 ， 在 执行 Java 类 的 过 程 中 ， 如 果 Java 类 需要 与 C 组 件 沟通 ， 虚 拟 机 就 会 去 载 入 C 组 
件 ， 然 后 让 Java 的 函数 顺利 地 调用 C 组 件 的 函数 。 此 时 ， 虚 拟 机 起 着 桥梁 的 作用 , 让 Java 与 C 
组 件 能 通过 标准 的 INT 界面 相互 沟通 。 

主要 的 JNI 代码 放 在 以 下 的 路 径 中 。 


frameworks/base/core/jni/ 
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以 我 们 在 如 下 情形 需要 用 到 JNI。 

(1) 所 开发 的 应 用 程序 要 用 到 与 平台 相关 的 属性 ， 而 Java 标准 类 库 不 支持 对 这 些 属性 的 
处 理 。 

(2) 已 经 拥有 了 用 其 他 编程 语言 实现 的 应 用 程序 或 库 ， 希 望 用 Java 直接 调用 这 些 实现 。 

G) 程序 的 某 个 模块 对 运行 的 时 间 效 率 要 求 很 高 ， 从 而 希望 用 较 低级 的 语言 (如 汇编 ) 来 实 
现 ， 同 时 希望 在 Java 应 用 程序 中 使 用 这 个 模块 。 

从 目前 市 场 上 对 JNI 应 用 的 案例 来 看 ， 最 主要 的 应 用 场景 一 般 是 源 于 上 面 的 第 二 点 原因 ， 
在 已 有 类 库 的 基础 上 进行 开发 平台 的 迁移 。 近来 比较 热门 的 Android 移动 终端 OS 平台 就 是 基于 
INI 技术 来 实现 的 。 从 其 本 质 上 说 ，Android 的 核 是 Linux 内 核 的 子 集 ， 基 于 该 内 核 使 用 Java 平 
台 进行 了 良好 的 封装 , 提供 给 开发 人 员 一 个 高 可 用 性 的 SDK 模板 。 开发 人 员 只 需 了 解 Java 平台 
的 特性 ， 根 据 API Documentation 就 完全 可 以 开始 编码 了 ， 并 不 需要 知道 其 内 部 的 实现 机 制 ， 当 
然 此 举 更 是 从 根本 上 劫持 了 诸多 原本 不 属于 该 开发 阵营 中 的 开发 人 员 ， 任 何 熟 悉 Java 平台 开发 
的 开发 人 员 顿 时 全 成 为 了 Android 平台 开发 的 潜在 用 户 。 

这 就 是 JNI 给 我 们 带 来 的 好 处 ， 借 助 Java 的 跨 平 台 特 性 ， 以 及 开发 阵营 的 强大 ， 各 大 企业 
和 机 构 基 于 已 有 的 类 库 和 程序 进行 二 次 封装 ， 不 仅 能 延续 产品 的 持续 发 展 ， 还 能 扩大 二 次 开发 
人 员 的 阵营 。 


11.1.3 JNI 的 结构 


当 一 个 Java 程序 调用 本 地 方法 时 ， 被 调用 的 方法 会 被 强制 接收 两 个 附加 在 调用 方法 上 的 参 
数 。 第 一 个 参数 是 JNIEnv 指针 , 第 二 个 参数 是 指向 调用 者 的 对 象 或 类 的 参考 引用 。 其 中 JNIEnv 
是 一 个 指针 ， 它 的 值 指向 另 一 个 指针 。 这 第 二 个 指针 指向 了 一 个 函数 表 ， 它 实际 上 是 一 个 指针 
数值 。 在 函数 表 里 面 的 每 个 指针 都 指向 一 个 JNI 接口 函数 。 为 了 调用 接口 函数 ， 我 们 必须 在 函 
数 表 里 面 得 到 正确 的 存放 位 置 。 让 我 们 看 看 如 何 通过 两 个 步 又 得 到 这 个 值 。 

(1) 首先 我 们 要 找到 第 二 个 指针 的 值 ， 换 句 话说 , 我 们 要 得 到 JNIEnv 指向 的 位 置 里 面 的 内 
容 ， 我 们 可 以 利用 下 面 的 代码 。 


mov ebx, JNIEnv mov eax, [ebx] 


第 一 个 指令 把 INIEnv 的 内 容 放 入 ebx 寄存 器 ， 然 后 把 ebx 这 个 地 址 指向 位 置 存放 的 值 放 入 
eax。 因 为 ebx 指向 的 内 容 和 JNIEnv 的 相同 ， 所 以 eax 现在 有 了 JNIEnv 指向 的 位 置 的 值 ， 这 意 
味 着 现在 的 eax 有 了 函数 表 的 起 始 地 址 。 

(2) 下 一 步 我 们 需要 从 函数 表 的 项 目 中 取出 指向 我 们 想 调用 的 接口 函数 的 值 。 为 了 做 到 这 
一 点 ， 我 们 必须 把 函数 索引 乘 以 4， 因 为 每 个 指针 是 4 字 节 长 度 ,然后 把 结果 加 上 我 们 在 前 面 存 
在 的 eax 里 面 的 函数 表 起 始 地 址 。 下 面 是 实现 代码 。 

mov ebx, eax ; save pointer to function table mov eax, index ; move the value of index 

into eax mov ecx, 4 mul ecx ; multiply index by 4 add ebx, eax ; ebx points to the desired 

entry mov eax, [ebx] ; eax points to the desired function 

寄存 器 eax 里 面 的 内 容 现在 可 以 用 来 调用 函数 了 。 

如 图 11-1 所 示 为 存 取 JNI 接 口 的 过 程 。 
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图 11-1 ER INI 接口 的 过 程 


11.1.4 JNI 的 实现 方式 


实现 INI 需要 在 Java 源 代 码 中 声明 ， 在 C++ 代码 中 实现 INI 的 各 种 方法 ， 并 把 这 些 方 法 注 
册 到 系统 中 。 实 现 JINI 的 核心 是 JNINativeMethod 结构 体 ， 实 现代 码 如 下 。 
typedef struct { 
const char* name; 
const char* signature; 
void* fnPtr; 
) JNINativeMethod; 
其 中 第 一 个 变量 name 是 Java 中 JNI 函数 的 名 字 ， 第 二 个 变量 signature 用 字符 串 描述 函数 
参数 和 返回 值 ， 第 三 个 变量 fnPtr 是 INI 函数 C 指针 。 
在 Java 代码 中 ， 定 义 的 函数 由 JNI 实现 时 ， 需 要 指定 函数 为 native。 
在 应 用 程序 中 使 用 JNI， 可 以 通过 代码 中 的 “/development/samples/SimpleJNI” 来 分 析 。 
(1) 分 析 顶 层 文件 Android.mk。 
LOCAL PACKAGE NAME := SimpleJNI // 生 成 PACKAGE 的 名 字 ， 在 out\target\product\ 
smdk6410\obj\APPS 
// 生 成 INT 共享 库 的 名 字 ， 在 smdk6410\obj\SHARED_LIBRARIES 
LOCAL JNI SHARED LIBRARIES := libsimplejni 


include $(BUILD PACKAGE) // 以 生成 APK 的 方式 编译 
include $(call all-makefiles-under,$(LOCAL PATH))  // 调 用 下 层 makefile 


(2) 分 析 JNI 目录 下 的 文件 Android.mk。 


LOCAL SRC FILES:- V / / TNT 的 c++ 源 文件 
native.cpp 
include $(BUILD SHARED LIBRARY) // 以 共享 库 方式 编译 


11.1.5. JNI 的 代码 实现 和 调用 
首先 看 文件 native.cpp 的 实现 代码 。 


static jint add(JNIEnv *env, jobject thiz, jint a, jint b){} //j& X Java Jjik add 
// 目 标 Java 类 路 径 
Static const char *classPathName = "com/example/android/simplejni/Native"; 
static JNINativeMethod methods[] = { // 本 地 实现 方法 列表 

{"add", "(II)I", (void*)add }, 


«e 


ig 
static int registerNativeMethods (UNIEnv* env, const char* className, 
JNINativeMethod* gMethods, int numMethods){} ， // 为 调用 的 某 个 Java 类 注册 本 地 INI 函数 
static int registerNatives (UNIEnvx env) {} // 为 当前 平台 注册 所 有 类 及 INI 函数 
jint JNI OnLoad(JavaVM* vm, void* reserved) // 为 当前 虚拟 机 平台 注册 本 地 INI 


在 上 述 代码 中 ， 从 下 到 上 依次 调用 三 个 JNI 函数 。 
再 看 文件 SimpleJNI java 的 代码 。 


package com.example.android.simplejni; //Java 包 ， 跟 文件 路 径 对 应 
import android.app.Activity; 

import android.os.Bundle; 

import android.widget.TextView; // 需 要 包含 的 类 ， 以 便 调用 函数 


public class SimpleJNI extends Activity { 


/** Called when the activity is first created. */ 
GOverride 


public void onCreate(Bundle savedInstanceState) { 


super.onCreate (savedInstanceState); 

TextView tv - new TextView(this); 

int sum = Native.add(2, 3); // 调 用 Native KMMM add, Yada 就 是 INI 函数 ， 由 CPP 实现 
tv.setText ("2 + 3 = " + Integer.toString(sum)); 

setContentView(tv); // 在 屏幕 上 显示 


} 


class Native { 


} 


static { 


// The runtime will add "lib" on the front and ".o" on the end of 
// the name supplied to loadLibrary. 


System.loadLibrary("simplejni");  // 载 和 由 native.cpp 生成 的 动态 库 ,全 名 是 1ib+simplejni+.o 


} 
static native int add(int a, int b) ;// 声 明 动态 库 中 实现 的 JNI BM add, fif Java 调用 


当 编译 生成 Java 包 后 ， 将 其 安装 到 MID 上， 运行 后 得 到 243-5. 


11.2. JNI 技术 的 功能 


在 Dalvik 虚拟 机 中 ， 通 常 使 用 JNI 调用 C/C++ 开发 的 共享 库 。JNI 技术 的 出 现 主要 是 基于 


三 个 方面 的 应 用 需求 。 

口 ”解决 性 能 问题。 

OQ ”解决 本 地 平台 接口 调用 问题 。 

D BARFE. 

下 面 将 详细 讲解 解决 上 述 三 个 方面 应 用 的 过 程 。 
11.2.44. 解决 性 能 问题 


Q^ 


Java 具有 平台 无 关 性 ， 这 使 人 们 在 开发 企业 级 应 用 时 总 是 把 它 作 为 主要 候选 方案 之 一 ， 但 
是 在 性 能 方面 的 因素 又 大 大 削弱 了 它 的 竞争 力 。 为 此 ， 提 高 Java 的 性 能 就 显得 十 分 重要 。Sun 
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公司 及 Java 的 支持 者 们 为 提高 Java 的 运行 速度 已 经 做 出 了 许多 努力 , 其 中 大 多 数 集中 在 程序 设 
计 的 方法 和 模式 选择 方面 。 由 于 算法 和 设计 模式 的 优化 是 通用 的 ， 对 Java 有 效 的 优化 算法 和 设 
计 模 式 ， 对 其 他 编译 语言 也 基本 同样 适用 ， 因 此 不 能 从 根本 上 改变 Java 程序 与 编译 型 语言 在 执 
行 效率 方面 的 差异 。 由 此 ， 于 是 人 们 开始 引入 JIT(Just In Time， 及 时 编译 ) 的 概念 。 它 的 基本 原 
Su. 

(1) 首先 通过 Java 编译 器 把 Java 源 代码 编译 成 平台 无 关 的 二 进 制 字 节 码 。 

Q) 然后 在 Java 程序 真正 执行 之 前 ， 系 统 通过 TIT 编译 器 把 Java 的 字 节 码 编译 为 本 地 化 机 
器 码 。 

(3) 最 后 ， 系 统 执行 本 地 化 机 器 码 ， 节 省 了 对 字 节 码 进行 解释 的 时 间 。 

这 样 做 的 优点 是 大 大 提高 了 Java 程序 的 性 能 ， 缩 短 了 加 载 程序 的 时 间 ; 同时 ， 由 于 编译 的 
结果 并 不 在 程序 运行 间 保存 ， 因 此 也 节约 了 存储 空间 。 但 其 缺点 是 由 于 JIT 编译 器 会 对 所 有 的 
代码 都 进行 优化 ， 因 此 同样 也 占用 了 很 多 时 间 。 

动态 优化 技术 是 提高 Java 性 能 的 另 一 个 尝试 。 该 技术 试图 通过 把 Java 源 程序 直接 编译 成 机 
器 码 ， 以 充分 利用 Java 动态 编译 和 静态 编译 技术 来 提高 Java 的 性 能 。 该 方法 把 输入 的 Java 源 
码 或 字 节 码 转换 为 经 过 高 度 优化 的 可 执行 代码 和 动态 库 (Windows 中 的 “.dll "格式 的 文件 或 Unix 
中 的 “.so” 格 式 的 文件 )。 该 技术 能 大 大 提高 程序 的 性 能 ， 但 却 破坏 了 Java 的 可 移植 性 。 

INI 技术 由 此 内 亮 登 场 。 因 为 采用 INT 技术 只 是 针对 一 些 严重 影响 Java 性 能 的 代码 段 ， 该 
部 分 可 能 只 占 源 程序 的 极 少 部 分 ， 所 以 几乎 可 以 不 考虑 该 部 分 代码 在 主流 平台 之 间 移 植 的 工作 
量 。 同 时 ， 也 不 必 过 分 担心 类 型 匹配 问题 ， 我 们 完全 可 以 控制 代码 不 出 现 这 种 错误 。 此 外 ， 也 
不 必 担心 安全 控制 问题 ， 因 为 Java 安全 模型 已 扩展 为 允许 非 系统 类 加 载 和 调用 本 地 方法 。 根 据 
Java 规范 ， 从 JDK 1.2 开始 ，FindClass 将 设法 找到 与 当前 的 本 地 方法 关联 的 类 加 载 器 。 如 果 平 
台 相 关 代 码 属于 一 个 系统 类 , 则 无 需 涉及 任何 类 加 载 器 ; 否则 , 将 调用 适当 的 类 加 载 器 来 加 载 和 
链接 已 命名 的 类 。 换 名 话说， 如 果 在 Java 程序 中 直接 调用 C/C++ 语言 产生 的 机 器 码 ， 该 部 分 代 
码 的 安全 性 就 由 Java 虚拟 机 控制 。 


11.22 ”解决 本 机 平台 接口 调用 问题 


Java 以 其 跨 平台 的 特性 深 受 人 们 喜爱 ， 而 又 正 由 于 其 跨 平台 的 特性 ， 使 得 它 和 本 地 机 器 之 
间 的 各 种 内 部 联系 变 得 很 少 ， 从 而 约束 了 它 的 功能 。 解 决 Java 对 本 地 操作 的 一 种 方法 就 是 JNI。 
Java 通过 INT 调用 本 地 方法 ， 而 本 地 方法 是 以 库 文 件 的 形式 存放 的 (在 Windows 平台 上 是 dll 文 
件 形式 ， 在 Unix 机 器 上 是 so 文件 形式 )。 通 过 调用 本 地 的 库 文件 的 内 部 方法 ， 使 Java 可 以 实现 
和 本 地 机 器 的 紧密 联系 ， 调 用 系统 级 的 各 个 接口 方法 。 


11.2.3 mhARA AMA 


“一 次 编程 ， 到 处 使 用 ”的 Java 软件 概念 原本 就 是 针对 网 上 嵌入 式 小 型 设备 提出 的 ， 
J2ME(Java 2 Platform Micro Edition) 是 一 款 针对 信息 家 电 的 Java 版 本 ， 其 技术 日 趋 成 熟 , 并 已 开 
始 投入 使 用 。 随 着 Java 虚拟 机 技术 的 有 序 开放 , 使 得 Java 软件 能 够 真正 实现 跨 平 台 运行 , Bl Java 
应 用 小 程序 能 够 在 带 有 Java 虚拟 机 VM 的 任何 硬 软件 系统 上 执行 。 加 上 Java 本 身 所 具有 的 安全 
性 、 可 靠 性 和 可 移植 性 等 特点 ， 对 实现 瘦身 上 网 的 信息 家 电 等 网 络 设备 十 分 有 利 ， 同 时 对 嵌入 
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式 设备 特别 是 上 网 设备 软件 编程 技术 产生 了 很 大 的 影响 。 也 正 是 由 于 INI 解决 了 本 机 平台 接口 
调用 问题 ， 于 是 INI 在 嵌入 式 开 发 领域 也 是 如 火 如 蔡 。 


11.3 在 Android 中 使 用 JNI 


经 过 本 章 前 面 内 容 的 学 习 , 了 解 了 JNI 的 基本 知识 。 本 节 将 详细 讲解 在 Android 系统 中 使 用 
JNI 的 基本 流程 ， 为 读者 步 入 本 书后 面 知识 的 学 习 打 下 基础 。 


11.3.1 使 用 JNI 的 流程 


使 用 INI 的 基本 流程 如 下 。 

(1) 在 工程 下 建立 一 个 JNI 目 录 , 目录 下 建立 一 个 Android.mk 文 件 (可 以 到 ndk 文 档 中 复制 )。 

(2) 在 Java 文件 中 建立 需要 的 native( 本 地 ) 方 法 

(3) 在 工程 的 bin/classes 目录 下 用 javah 生成 所 要 的 头 文件 

(4) 将 头 文件 copy( 复 制 ) 到 INI 目录 下 ， 再 建立 一 个 “.c” 格 式 文件 ， 并 且 在 该 文件 中 实现 
头 文件 中 的 方法 。 

(5) 找到 /cygdrive/d/workspace/ 工 程 名 ， 使 用 ndk-build 编译 。 


11.3.2 ”使 用 INI 技术 来 进行 二 次 封装 


使 用 JNI 技术 进行 二 次 封装 的 基本 流程 如 下 。 
(1) 编写 并 编译 Java 代码 
使 用 IDE 工具 编写 Java 代码 ， 例 如 保存 在 如 下 路 径 中 。 


E:\JavaWorkspace\Laputa\com\laputa\jni\test\HelloJNIWorld. java 


演示 文件 HelloJNIWorld java 的 代码 如 下 。 


package com.laputa.jni.test 

public class HelloJNIWorld[ 

public native void sayHello(); 

public static void main(String[] args) { 
HelloJNIWorld hello = new HelloJNIWorld() ; 
hello.sayHello(); 

} 

} 


进入 E\JavaWorkspace\Laputa\, 使 用 命令 javac com\laputa\jni\test\HelloJNIWorld.java 编译 该 
文件 ,由 于 未 指定 编译 结果 路 径 , 生成 的 class 文件 将 保存 在 源 文件 同一 目录 下 , 得 到 如 下 文件 。 

E:\JavaWorkspace\Laputa\com\laputa\jni\test\HelloJNIWorld.class 

Q) 生成 JNI 头 文件 

使 用 如 下 javah 命令 生成 头 文件 。 


javah -jni com.laputa.jni.test.HelloWorld 
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这 样 将 会 生成 如 下 文件 。 


E:\JavaWorkspace\Laputa\com laputa jni test HelloJNIWorld.h 


在 生成 头 文件 时 需要 注意 如 下 两 点 。 

口 在 javah -jni 后 面 需要 写 类 的 全 限定 名 (自行 查阅 资料 了 解 全 限定 名 相关 知识 )， 并 且 
执行 该 命令 的 当前 目录 下 要 能 找到 全 限定 名 中 的 路 径 ， 也 就 是 说 执行 命令 的 路 径 应 该 
在 包 路 径 的 上 一 层 目录 , 这 里 我 们 将 com. laputa jnitest 包 保存 在 E:\JavaWorkspace\Laputa 
目录 下 ， 那 么 我 们 执行 javah 命令 的 路 径 也 应 该 是 E:\JavaWorkspace\Laputa。 

口 “ 当 未 指定 生成 头 文件 的 目标 目录 时 ， 默 认 将 头 文件 生成 在 当前 目录 下 。 头 文件 的 样式 
如 下 。 


#include <jni.h> 

/* Header for class com_laputa_jni_test_HelloJNIWorld */ 
#ifndef _Included_com_laputa_jni_test_HelloJNIWorld 
#define Included com laputa jni test HelloJNIWorld 
#ifdef _ cplusplus 

extern "C" { 

#endif 

JNIEXPORT void JNICALL Java com laputa jni test HelloJNIWorld sayHello 
(JNIEnv *, jobject); 

#ifdef _ cplusplus 

} 

#endif 

#endif 


(3) 实现 头 文件 对 应 的 方法 

接 下 来 实现 刚才 生成 的 头 文件 中 的 sayHello 方法 , 至 于 方法 名 为 何 这 么 长 , 主要 是 因为 JNI 
就 是 通过 这 样 的 机 制 来 识别 方法 签名 的 。 在 开发 过 程 中 需要 注意 的 是 , 对 于 Java 文件 中 的 native 
方法 最 好 不 要 使 用 重 载 ， 因 为 重 载 后 的 native 方法 生成 的 头 文件 中 的 方法 将 会 非常 之 长 ， 重 载 
的 方法 名 中 将 会 包含 其 参数 信息 ， 例 如 在 HelloJNIWorld.java 中 添加 一 个 public native void 
sayHello(String str); 方 法 ， 其 生成 的 头 文件 中 对 应 方法 将 会 如 下 。 

JNIEXPORT void JNICALL Java com laputa jni test HelloJNIWorld sayHello Ljava 


lang String 2 
(JNIEnv *, jobject, jstring); 


这 会 让 我 们 在 查看 代码 时 感到 迷惑 ， 所 以 建议 在 需要 重 载 时 直接 使 用 其 他 的 名 称 ， 放 弃 重 
载 为 后 期 维护 提供 可 读 性 更 高 的 代码 。 
接 下 来 就 可 以 开始 实现 我 们 需要 的 方法 了 ， 例 如 Java 代码 中 需要 调用 sayHello 这 个 本 地 方 
那么 我 们 新 建 一 个 对 应 的 cpp 文件 ， 将 方法 签名 复制 至 cpp 文件 中 ， 实 现 该 方法 。 


#include "com laputa jni test HelloJNIWorld.h" 

#include <iostream> 

using namespace 

std; 

JNIEXPORT void JNICALL Java com laputa jni test HelloJNIWorld sayHello 
( 

JNIEnv *, jobject) 


{ 


法 
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std::cout << "Hello JNI World" << std::endl; 

} 

(4) 编译 链接 库 并 添加 至 系统 Path 变量 中 

使 用 合适 的 编译 器 (VC/GCC) 进 行 编译 和 链接 , 生成 合适 的 链接 库 (dll 或 者 so 文件 )。 在 编译 
过 程 中 可 能 出 现 头 文件 包含 出 现 错误 的 问题 ， 主 要 是 因为 在 生成 的 JNI 头 文件 中 有 如 下 代码 
语句 : 

#include <jni.h> 


编译 器 会 到 系统 路 径 下 去 查找 外 部 头 文件 ， 因 此 需要 我 们 在 编译 的 IDE 或 者 脚本 中 指定 该 
文件 所 在 的 目录 为 编译 时 Include 路 径 , 另外 在 文件 jinih 中 可 能 需要 使 用 到 与 平台 相关 的 一 些 文 
件 ， 例 如 在 Windows 平台 下 需要 使 用 到 文件 jni_md.h， 该 文件 处 于 JDK 安装 目录 的 include 目 
录 下 的 win32 路 径 下 (其 他 平台 也 处 于 include 的 相应 目录 下 )， 需 要 将 这 个 文件 所 在 的 目录 也 添 
加 到 编译 时 的 Include 路 径 中 ， 保 证 编译 通过 。 将 该 文件 加 入 系统 Path 目录 下 (不 同 的 平台 使 用 
其 特定 方式 进行 添加 ， 在 不 是 Windows 平台 下 使 用 export 命令 设置 名 为 LD LIBRARY PATH 
的 路 径 参 数值 为 库 文件 所 在 目录 )， 以 便 Java 程序 能 加 载 该 库 文件 。 当 Java 加 载 库 文件 时 ， 需 
要 库 文件 在 系统 的 Path F- 

(5) 在 Java 程序 中 加 载 库 文件 并 执行 代码 

在 Java 程序 中 使 用 System.loadLibrary(String libName) 加 载 系 统 路 径 下 的 库 文件 (忽略 后 缀 
名 )。 加 载 库 文件 的 代码 可 以 使 用 静态 域 进行 加 载 ， 使 得 类 在 加 载 之 初 就 加 载 库 文件 ， 并 且 之 后 
在 当前 Java 虚拟 机 实例 中 共享 使 用 ， 不 需 重复 加 载 库 文件 。 在 代码 中 添加 下 面 的 代码 : 


static( 
System.loadLibrary ("HelloJNIWorld"); 


重新 编译 并 执行 代码 ， 在 程序 将 在 控制 台中 会 输出 如 下 内 容 : 
Hello JNI World 


上 述 就 是 HelloWorld 的 整个 编码 过 程 了 。 这 是 一 个 非常 简单 的 例 程 ， 当 然 在 实际 的 产品 i 
计 中 会 使 用 更 多 的 一 些 技巧 和 设计 原则 。 


11.3.3 Android JNI 使 用 的 数据 结构 JNINativeMethod 


在 Andoird 系统 中 , 使 用 了 一 种 不 同 传统 Java INI 的 方式 来 定义 其 native 的 函数 。 其 中 很 重 
要 的 区 别 是 ，Andorid 使 用 了 一 种 Java 和 C 函数 的 映射 表 数 组 ， 并 在 其 中 描述 了 函数 的 参数 和 
返回 值 。 这 个 数组 的 类 型 是 JNINativeMethod， 定 义 代码 如 下 。 
typedef struct { 
const char* name; 
const char* signature; 
void* fnPtr; 
} SNINativeMethod; 


Q 变量 name: 是 Java 中 函数 的 名 字 。 
O 2H signature: 用 字符 串 是 描述 了 函数 的 参数 和 返回 值 。 


Q^ 
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O ZE MP: 是 函数 指针 ， 指 向 C 函数 。 

其 中 比较 难以 理解 的 是 第 二 个 参数 ， 代 码 如 下 。 

"pv" 

"(II)V" 

" (bjava/lang/String;Ljava/lang/String;)V" 

实际 上 这 些 字符 是 与 函数 的 参数 类 型 一 一 对 应 的 ， 具 体 说 明 如 下 。 

QO "0": 里 面 的 字符 : 表示 参数 ， 后 面 的 则 代表 返回 值 。 例 如 "0V"” 就 表示 void Func();. 
Q "DV": 表示 void Func(int, int);. 

具体 的 每 一 个 字符 的 对 应 关系 如 下 。 


字符 Java 类 型 C 类 型 
V void void 
Z jboolean boolean 
I jint int 

I jlong long 
D jdouble double 
F jfloat float 

B jbyte byte 

€ jchar char 

S jshort short 

数组 则 以 “[” 开 始 ， 用 两 个 字符 表示 : 
[I jintArray int[] 

[F jfloatArray float[] 

[B jbyteArray byte[] 

[C jcharArray char[] 

[S jshortArray short[] 

[D jdoubleArray double[] 

IM jlongArray long[] 


IVA jbooleanArray boolean[] 

上 面 的 都 是 基本 类 型 。 如 果 Java 函数 的 参数 是 class， 则 以 “IL” 开头 ， 以 “;” 结 尾 ， 中 间 
是 用 “/” 隔 开 的 包 及 类 名 。 而 其 对 应 的 C 函数 名 的 参数 则 为 jobject。 

如 果 Java 函数 位 于 一 个 嵌入 类 ， 则 用 $ 作 为 类 名 间 的 分 隔 符 。 代 码 如 下 。 


(Ljava/lang/String;Landroid/os/FileUtils$FileStatus;)Z 


11.3.4 通过 JNI 实现 Java 对 C/C++ 函数 的 调用 


在 接 下 来 的 内 容 中 ， 以 一 段 简 单 的 “HelloWorld” 程 序 为 例 ， 讲 解 Android 是 如 何 通过 INI 
实现 Java 对 C/C++ 函数 的 调用 过 程 。 
(1) 使 用 Java 编写 能 够 输出 “HelloWorld” 的 Android 应 用 程序 ， 演 示 代 码 如 下 。 


package com.lucyfyr; 
import android.app.Activity; 
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import android.os.Bundle; 
import android.util.Log; 


public class HelloWorld extends Activity { 

/** Called when the activity is first created. */ 

GOverride 

public void onCreate(Bundle savedInstanceState) { 
super.onCreate (savedInstanceState); 
setContentView(R.layout.main); 
Log.v("dufresne", printJNI("I am HelloWorld Activity")); 


) 


static 


{ 
// 加 载 库 文件 
System. loadLibrary ("HelloWorldJni"); 


} 
// 声 明 原生 函数 参数 为 String 类 型 返回 类 型 为 String 
private native String printJNI(String inputStr); 


} 


这 一 步骤 可 以 使 用 Eclipse 生成 一 个 App， 因 为 Eclipse 会 自动 为 我 们 编译 此 Java 文件 ， 并 
在 后 面 的 步 又 中 要 用 到 。 

(2) 生成 共享 库 的 头 文件 。 先 进入 到 eclipse 生成 的 Android Project 的 如 下 目录 中 。 

/HelloWorld/bin/classes/com/lucyfyr/ 


在 里 面 可 以 看 到 里 面 后 很 多 后 绷 为 .class 的 文件 , 这 就 是 Eclipse 为 我 们 自动 编译 好 了 的 Java 
文件 ， 其 中 就 有 文件 HelloWorld.class。 然 后 退回 到 classes 一 级 目录 。 
/HelloWorld/bin/classes/ 


并 执行 如 下 命令 。 

javah com.lucyfyr.HelloWorld 
这 样 会 生成 文件 。 

com lucyfyr HelloWorld.h 
演示 代码 如 下 。 


#include <jni.h> 

/* Header for class com lucyfyr HelloWorld */ 
#ifndef Included com lucyfyr HelloWorld 

#define Included com lucyfyr HelloWorld 

#ifdef _ cplusplus 

extern "c" { 

#endif 

/* 

* Class: com lucyfyr HelloWorld 

* Method: printJNI 

* Signature: (Ljava/lang/String;)Ljava/lang/String; 
a 

JNIEXPORT jstring JNICALL Java com lucyfyr HelloWorld printJNI 
(JNIEnv *, jobject, jstring); 
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#ifdef _ cplusplus 
} 

#endif 

#endif 


此 时 可 以 看 到 自动 生成 对 应 的 函数 Java com lucyfyr HelloWorld printJNI， 其 名 字 格 式 
如 下 。 


Java_ + 包 名 (com.lucyfyr) + $ (HelloWorld) + 接口 名 (printJNI) 


我 们 必须 按 此 JNI 命名 规范 来 操作 ，Java 虚拟 机 就 可 以 在 类 com.simon.HelloWorld 中 调用 
printJNI 接口 时 自动 找到 这 个 C 实现 的 Native 函数 调用 。 当 然 如 果 函 数 名 太 长 ， 可 以 在 “.c” 
件 中 通过 函数 名 映射 表 来 实现 简化 。 

(3) 实现 INI 原生 函数 源 文件 ， 新 建文 件 com_lucyfyr HelloWorld.c， 演 示 代 码 如 下 。 


#include «jni.h» 
#define LOG TAG "HelloWorld" 
#include <utils/Log.h> 
/* Native interface, it will be call in java code */ 
JNIEXPORT jstring JNICALL Java com lucyfyr HelloWorld printJNI(JNIEnv *env, jobject 
obj,jstring inputStr) 
{ 
LOGI ("dufresne Hello World From libhelloworld.so!") ; 
//  instring 字符 串 取 得 指向 字符 串 UTF 编码 的 指针 
const char *str = 
(const char *) (*env) ->GetStringUTFChars( env,inputStr, JNI FALSE ); 
LOGI ("dufresne--->%s", (const char *)str); 
// 通知 虚拟 机 本 地 代码 不 再 需要 通过 str 访问 Java 字符 串 。 
(*env) ->ReleaseStringUTFChars(env, inputStr, (const char *)str ); 
return (*env)-»NewStringUTF(env, "Hello World! I am Native interface"); 


} 


/* This function will be call when the library first be load. 

* You can do some init in the libray. return which version jni it support. 
E 

jint JNI OnLoad(JavaVM* vm, void* reserved) 


{ 


void *venv; 

LOGI ("dufresne----- »JNI OnLoad!"); 

if ((*vm)->GetEnv(vm, (void**)&venv, JNI VERSION 1 4) !- JNI OK) { 
LOGE("dufresne---»ERROR: GetEnv failed"); 
return -1; 


} 


return JNI VERSION 1 4; 
} 
其 中 函数 OnLoadJava com lucyfyr HelloWorld printUNIO 用 于 实现 日 志 输出 , 在 此 需要 注意 
JNI 中 的 日 志 输 出 的 不 同 。 
JNI OnLoad 函数 是 符合 INI 规范 定义 的 ， 当 共享 库 第 一 次 被 加 载 的 时 候 会 被 回调 ， 在 这 个 
函数 里 可 以 进行 一 些 初始 化 工作 ， 比 如 注册 函数 映射 表 ， 缓 存 一 些 变量 等 ， 最 后 返回 当前 环境 
所 支持 的 INI 环境 。 本 例 只 是 简单 的 返回 当前 INI 环境 。 
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(4) 编译 生成 so FE. 
编译 文件 com lucyfyr HelloWorld.c 生成 so 库 ， 可 以 和 app 一 起 编译 ， 也 可 以 单独 编译 。 
在 当前 目录 下 建立 INI 文件 夹 : HelloWorld/jini/， 然 后 在 里 面 建立 文件 Android.mk， 并 将 文件 
com lucyfyr HelloWorld.c 和 文件 com lucyfyr HelloWorld.h 复制 进去 。 
编写 编译 生成 so ERY Android.mk 文件 。 
LOCAL PATH:- $ (call my-dir) 
# 一 个 完整 模块 编译 
include $(CLEAR VARS) 
LOCAL SRC FILES:-com lucyfyr HelloWorld.c 
LOCAL C INCLUDES := $(JNI H INCLUDE) 
LOCAL MODULE := libHelloWorldJUni 
LOCAL SHARED LIBRARIES :- libutils 
LOCAL PRELINK MODULE :- false 
LOCAL MODULE TAGS :-optional 
include $(BUILD SHARED LIBRARY) 
对 各 个 系统 变量 的 具体 说 明 如 下 。 
Q LOCAL PATH: 编译 时 的 目录 。 
O $al 目录 ， 目 录 ….): 引入 操作 符 ， 如 该 目录 下 有 个 文件 夹 名 称 sre， 则 可 以 这 样 写 
$(call sre)， 那 么 就 会 得 到 src 目录 的 完整 路 径 。 
include $(CLEAR_VARS): 清除 之 前 的 一 些 系 统 变量 。 
LOCAL MODULE: 编译 生成 的 目标 对 象 。 
LOCAL SRC FILES: 编译 的 源 文件 。 
LOCAL C INCLUDES: 需要 包含 的 头 文件 目录 。 
LOCAL SHARED LIBRARIES: 链接 时 需要 的 外 部 库 。 
ILOCAL PRELINK MODULE: 是否 需要 prelink 处 理 。 
include$(BUILD SHARED LIBRARY): 指明 要 编译 成 动态 库 。 
接 下 来 开始 编译 此 模块 ， 输 入 如 下 编译 命令 。 


./makeMtk mm packages/apps/HelloWorld/jni/ 

上 面 是 笔者 的 工程 根 目录 编译 命令 ， 具 体 编译 方式 根据 自己 系统 要 求 执行 。 编 译 后 会 输出 
如 下 结果 。 

libHelloWorlddni.so (system/1ib 中 视 具体 而 定 ) 

此 时 的 库 文件 已 经 编译 好 并 可 以 使 用 了 ， 如 果 在 Eclipse 中 模拟 器 上 使 用 ， 需 要 将 
libHelloWorldJni.so 导入 到 system/lib 下 ,或 者 对 应 app 的 data/data/com.lucyfyr/lib/ 下 。 在 导入 到 
system/lib 下 的 时 候 ， 虽然 始终 提示 “out of memory” , 但 是 可 以 导入 到 data/data/com.lucyfyr/lib/ 
下 使 用 。 

接 下 来 看 一 下 HelloWorld 中 Android.mk 文件 的 配置 ， 其 中 存在 : 

include $(LOCAL_PATH) /jni/Android.mk /// 表 示 编 译 库 文件 

LOCAL JNI SHARED LIBRARIES := libHelloWorldJni  — /// 表 示 app 依赖 库 ， 打 包 的 时 候 会 一 起 打包 。 

(5) 验证 执行 。 

将 编译 好 的 apk 安装 到 手机 上 ， 当 使 用 adb 命令 传 到 手机 上 时 ， 需 要 自己 去 导入 库 文 件 


CCCCDODU 
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libHelloWorldJni.so 到 data/data/com.lucyfyr/lib/ . 
如 果 使 用 adb install 方式 安装 则 会 自动 导入 ， 启 动 HelloWorld， 输 入 下 面 的 命令 : 


adb logcat |grep dufresne 

输出 如 下 的 日 志 。 

I/HelloWorld(28500): dufresne Hello World From libhelloworld.so! 

I/HelloWorld(28500): dufresne---»I am HelloWorld Activity 

V/dufresne(28500): Hello World! I am Native interface 

由 此 可 见 ， 完 全 符合 调用 的 打印 顺序 。 这 样 通过 一 个 简单 的 演示 代码 ， 学 习 了 Android 如 
何 编写 编译 C 库 文件 ， 以 及 如 何 使 用 库 文件 的 过 程 。 对 于 JNI 的 使 用 ， 其 中 还 涉及 到 了 C++ 接 
口 的 调用 、 函 数 名 注册 、 参 数 类 型 的 匹配 、JNI 如 何 调用 Java 中 的 方法 java<--->JNI 等 知识 。 


11.8.5 调用 Native( 本 地 ) 方 法 传递 参数 并 且 返 回 结果 


下 面 动 手 来 实现 使 用 JNI 调用 本 地 方法 ， 演 示 Java 调用 Native 本 地 方法 传递 参数 并 且 返 回 
结果 的 具体 流程 。 
(1) 编写 Java 端 代 码 
首先 定义 一 个 Java 类 ， 演 示 代 码 如 下 。 
public class TestNativeDemo { 
// 声明 本 地 方法 
public native String testJni (String arg); 
static { 


// 加 载 DLL 文件 
System.loadLibrary ("TestNativeDemoCPP"); 


) 
public static void main(String args[]) ( 
TestNativeDemo ob - new TestNativeDemo(); 
// 调用 本 地 方法 
String result = ob.testJni("Hello,Jni"); // call a native method 
System.out.println("TestNativeDemo.testJUni-" + result); 


) 
} 


编译 上 述 代 码 , 在 生成 TestNativeDemo.class 的 bin 目录 下 执行 javah TestNativeDemo 命令 ， 
这 样 可 以 生成 头 文 件 TestNativeDemo.h。 


#include <jni.h> 

/* Header for class TestNativeDemo */ 

#ifndef Included TestNativeDemo // 避 免 重 复 包含 头 文件 

#define Included TestNativeDemo 

#ifdef _ cplusplus //c++ 编 译 环境 中 才 会 定义 _cplusplus 

extern "C" ( // 告 诉 编 译 器 下 面 的 函数 是 c 语言 函数 (因为 c++ 和 c 语言 对 函数 的 编译 转换 不 一 样 ， 主 要 是 c++ 
中 存在 重 载 ) 


* Class: TestNativeDemo 
* Method: testJni 


«e 


* Signature: (Ljava/lang/String;)Ljava/lang/String; 
57 
JNIEXPORT jstring JNICALL Java TestNativeDemo testJni 
(JNIEnv *, jobject, jstring); 


#ifdef cplusplus 
} 

#endif 

#endif 


(2) 生成 DLL 库 

先 打 开 Visual Studio 2010， 创 建 一 个 名 称 为 TestNativeDemoCpp 的 C++ Win32 项 目 。 在 向 
导 的 应 用 程序 类 型 处 选择 DLL， 单 击 “ 完 成 ”按钮 ， 设 置 Release+Win32 编译 配置 。 

然后 将 签名 生成 的 文件 TestNativeDemo.h 复制 到 TestNativeDemoCpp 项 目的 根 目录 下 ， 然 
后 在 Visual Studio 2010 中 右键 单 击 头 文件 文件 夹 添加 现 有 项 把 这 个 头 文件 包含 进来 。 最 后 编辑 
文件 TestNativeDemoCpp.cpp。 


// TestNativeDemoCpp.cpp : 定义 DLL 应 用 程序 的 导出 函数 
#include "stdafx.h" 
#include <jni.h> 
#include "TestNativeDemo.h" 
#include <stdio.h> 
JNIEXPORT jstring JNICALL Java TestNativeDemo testJni (JNIEnv *env, jobject obj, jstring 
pString) { 
// 从 jstring 中 获取 本 地 方法 传递 的 字符 串 
const char *nativeString = env-»GetStringUTFChars (pString, 0); 
printf("$s", nativeString); 
//DON'T FORGET THIS LINE!!! 
env-»ReleaseStringUTFChars (pstring, nativeString); 
return pString; 


} 

Visual Studio 2010 开发 环境 默认 不 会 识别 jnih 头 文件 , 在 IDK 中 找到 文件 jnih， 并 添加 文 
件 jnih 所 在 目录 到 当前 工作 路 径 ， 方 法 是 右 击 项 目 ， 依 次 选择 “属性 ”一 “通用 属性 ”一 C/C++ 
一 “常规 项 ”， 在 右边 的 附加 包含 目录 中 把 下 面 内 容 添 加 进来 。 

$JAVA HOME%/include 和 %JAVA HOME%/include/win32 

右 击 项 目的 资源 文件 加 入 “资源 -版 本 ”信息 。 编 译 项 目 ， 在 项 目的 Release 下 面 找到 
TestNativeDemoCpp.dll 文件 ， 也 有 可 能 在 项 目的 上 层 目录 的 release 下 边 ， 跟 设置 有 关 。 

G) 运行 Java 调用 DLL 程序 

把 第 (2) 步 生成 的 TestNativeDemoCpp.dll 文件 复制 到 第 一 步 产生 TestNativeDemo.class 的 同 
一 目录 ， 然 后 执行 如 下 命令 。 

java TestNativeDemo 

这 样 会 输出 如 下 结果 。 


Hello,JniTestNativeDemo.testJni=Hello,Jni 


Q^» 
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11.3.6 (AJNI BA C/C++ 开发 的 共享 库 


在 接 下 来 的 内 容 中 ,将 通过 演示 代码 来 讲解 在 Android 中 使 用 JNI 调用 用 C/C++ 开发 的 共享 
库 的 流程 。 

(1) 使 用 Eclipse 中 新 建 Android 工程 。 
工程 名 : INItest. 
Package 4: com.ura.test. 
Activity 4: JNItest. 
应 用 程序 名 : INItest. 
(2) 编写 布局 文件 main.xml， 演 示 代 码 如 下 。 

«?xml version-"1.0" encoding="utf-8"?> 
«LinearLayout xmlns:android="http://schemas.android.com/apk/res/android" 
android:orientation-"vertical" 


android:layout width-"fill parent" 
android:layout height-"fill parent" 


口 
口 
口 
口 


> 
<TextView 
android:id-"G«id/JNITest" 
android:layout width-"fill parent" 
android:layout height-"wrap content" 
android: text="@string/JNITest" 
/> 
«/LinearLayout» 


Q) 编写 文件 strings.xml， 演 示 代 码 如 下 。 


<?xml version="1.0" encoding="utf-8"?> 
<resources> 
<string name="JNITest">Hello World, JNItest!</string> 
<string name="app_name">JNItest</string> 
</resources> 
(4) 编辑 Java 文件 ， 演 示 代 码 如 下 。 
package com.ura.test; 
importandroid.app.Activity; 
import android.os.Bundle; 
importandroid.widget.TextView; 
public 
class JNItest extends Activity { 
/** Called whenthe activity is first created. */ 
static { 
System.loadLibrary ("JNITest"); 
} 
public native static StringGetTest () ; 
GOverride 
public 
void onCreate(BundlesavedInstanceState) { 
super.onCreate (savedInstanceState); 


<9 
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setContentView(R.layout.main); 

String str -GetTest(); 

TextViewJNITest - (TextView)findViewById(R.id.JNITest); 
JNITest.setText (str); 


} 


} 
(5) 进入 工程 的 主 目录 下 ， 然 后 用 javah 工具 生成 C/C++ 头 文件 ， 如 图 11-2 所 示 。 


:NandroidNdemo NJNIte > Je path bin -d jni 
图 11-2 生成 C/C++ 头 文件 
然后 将 在 主 目录 下 生成 INI 文件 夹 ， 如 图 11-3 所 示 。 


OQAR- O- f$ PRR OAK E 
Hi Q) [3 D: Venároi Meno JN test 


文件 和 文件 志 任 务 cJ sides CJ T bin 
E AB-I 
@ 将 这 个 文件 夹 发 布 到 > > 
Web c jni CJ res src 
kg HH 
|= . project ^ AndroidMani fest. xml default. prop: 
HH PROJECT 文件 di »cument PROPERTIES 2 
1 Kb pi 1 KB 


图 11-3 生成 JNI 文 件 来 
可 以 发 现在 里 面 有 一 个 如 图 11-4 所 示 的 文件 。 
JEE- O- A| PRR OUR | 国 - 
IE (D) |E D: \android\demo\JNItest\jni 


com ura test JNI... 


RAMA RES A 


= y Jia file 
mw] 重 命名 这 个 文件 » 
gy 移动 这 个 文件 
D Sabet 


图 11-4 ji 目录 下 的 文件 
头 文件 的 内 容 如 下 。 


/* DO NOT EDIT THIS FILE - it is machine generated */ 
#include «jni.h» 
/* Header for class com ura test JNItest */ 


#ifndef Included com ura test JNItest 
#define Included com ura test JNItest 
#ifdef cplusplus 
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extern "C" { 

#endif 

/* 

* Class: com ura test JNItest 

* Method: GetTest 

* Signature: ()Ljava/lang/String; 

x 

JNIEXPORT jstring JNICALL Java com ura test JNItest GetTest 
(JNIEnv *, jclass); 


#ifdef cplusplus 
} 

#endif 

#endif 


(6) 在 JNI 文 件 夹 下 编写 C/C++ 文件 ， 演 示 代 码 如 下 。 


#include <stdio.h> 
#include <stdlib.h> 
#include <utils/Log.h> 
#include "com ura test JNItest.h" 
JNIEXPORT jstring JNICALL Java com ura test JNItest GetTest 
(JNIEnv *env, jclass obj) 
{ 
LOGD("Hello LIB!/n"); 
return (*env)-»NewStringUTF(env, "JNITest Native String"); 


} 
(7) 在 JNI 文 件 夹 下 编写 文件 androidmk， 演 示 代 码 如 下 。 


LOCAL PATH:= $ (call my-dir) 
include $(CLEAR VARS) 
LOCAL SRC FILES:- / 
com ura test JNItest.c 
LOCAL C INCLUDES :- / 
$(JNI H INCLUDE) 
LOCAL SHARED LIBRARIES :- libutils 
LOCAL PRELINK MODULE :- false 
LOCAL MODULE :- libJNITest 
include $(BUILD SHARED LIBRARY) 


(8) 编译 生成 动态 库 ， 在 ubuntu 的 Android 源码 下 面 新 建文 件 夹 。 

~/myandroid/external/libJNITest 

将 文件 夹 jni 中 编写 好 的 头 文件 、C/C++ 源 文件 和 make 文件 复制 上 面 的 目录 中 ， 然 后 在 
ubuntu 中 执行 如 下 的 命令 。 


Cd myandroid 

. ./build/envsetup.sh 
Cd external/libJNITest/ 
Mm 


操作 命令 如 图 11-5 所 示 。 


«e 


a 
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图 11-5 操作 命令 
译 成 功 的 后 会 在 下 面 的 目录 中 生成 ibJNITest.so 文件 。 


-myandroid/out/target/product/generic/system/lib/ 
然后 将 文件 libJNITest.so 复制 到 Android SDK 主 目录 中 的 tools 文件 夹 下 。 
(9) 在 模拟 器 中 执行 程序 。 
启动 模拟 器 ， 进 入 SDK 主 目录 下 的 tools 文件 夹 ， 如 图 11-6 Aras. 
11-6 进入 SDK 主 目录 下 的 tools 文件 夹 
输入 adbdevices 命令 ， 如 图 11-7 所 示 。 


iD = Nandro id\android-sdk-windows \tools>adb devices 
List of devices attached 
lenulator-5554 device 


11-7 输入 adbdevices 
然后 输入 adb remount 命令 ， 如 图 11-8 所 示 。 


D: Nandro id\Nandro id-sdk-windows \tools>adb remount 
remount succeeded 


图 11-8 输入 adb remount 命令 
然后 输入 adb push libJNITest.so /system/lib 命令 ， 如 图 11-9 所 示 。 


D: Nandroid\android-sdk-windows \tools>adb push libJNITest.so /system/lib 


39 KB/s <Ø butes in 5064.000s5 


Bl 11-9 输入 adb remount 命令 
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e 
如 果 成 功 ， 则 可 以 看 到 如 图 11-10 所 示 的 界面 。 
dD OOP- iF ? o o- ES [p mus |& Java 
È Threads | 国 Heap | 目 Allocation Tracker A P ^ CX ma -7° 
Hane Size Date Time Perniss... Info 
E 世 fonts 2010-11-15 10:00 drwxr-xr-x 
B & framework 2010-11-15 14:07 
S © lib 2010-11-23 09:17 
aS eel 2010-11-15 12:59 
Bh 2010-11-15 12:58 
invoke mock media player. so 5524 2010-11-15 12:58 
libEGL so 36100 2010-11-15 12:58 
libETCl. so 9240 2010-11-15 12:55 
libFFTEn. so 198080 2010-11-15 13:02 
LibGLESv1 _CH. so 21424 2010-11-15 12:58 
libGLESv2. so 17328 2010-11-15 12:58 
libJWITest. so 5064 2010-11-23 07:51 
libSR AudicIn.so 17700 2010-11-15 12:59 ~ 
libacc. so 38948 2010-11-15 12:58 
libandroid runtime. so 477658 2010-11-15 12:59 ~ 
libandroid servers. so 18172 2010-11-15 13:31 
libaudi oflinger. so 213652 2000-11-15 12:59 


图 11-10 ”成功 后 的 界面 
上 面 开 的 模拟 器 不 要 关闭 ， 关 掉 再 开动 态 库 就 没有 了 ， 模 拟 器 中 的 system 是 只 读 的 。 
(10) 运行 程序 。 
运行 Eclipse 下 的 JNITest 工程 ， 运 行 效果 如 图 11-11 所 示 。 


Intent € act-a 


UNCHER] F1g-0x10200000 


11-11 运行 效果 


11.3.7 ”使 用 线程 及 回调 更 新 UI 


在 Android 使 用 JNI 时 ， 为 了 能 够 使 UI 线程 即 主线 程 与 工作 线程 分 开 ， 经 常 要 创建 工作 线 
程 ， 然 后 在 工作 线程 中 调用 C/C++ 函数 。 为 了 在 C/C++ 函数 中 更 新 Android 的 UI， 有 时 会 经 常 
使 用 回调 。 为 了 保证 C/C++ 的 工作 函数 以 及 回调 函数 都 能 轻易 同时 被 Java 的 UI 线程 和 创建 的 
工作 线程 识别 , 在 声明 native 时 经 常 要 将 其 声明 成 静态 函数 但 是 用 静态 函数 更 新 UI 时 会 出 现 麻 
烦 。 在 下 面 的 内 容 中 ， 将 通过 演示 代码 来 讲解 使 用 线程 及 回调 更 新 UI 的 思路 。 

(1) 编写 Java 文件 EagleUILjava， 演 示 代 码 如 下 。 


package eagle.test; 
public class EagleUI extends Activity 
{ 
TextView mTextView; 
MainHandler  mMainHandler; 
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static MainHandler mHandler; 


static 


{ 
System. loadLibrary ("EagleZip");// 声明 所 要 调用 的 库 名 称 


GOverride 
public void onCreate(Bundle savedInstanceState) 


{ 


super .onCreate (savedInstanceState) ; 

mTextView- (TextView)findViewById (R.id.MyTextView); 
mMainHandler-new MainHandler () ; 
mHandler=mMainHandler; 

WorkThread tThread = new WorkThread (); 

new Thread(tThread) .start () ; 


public static void myCallbackFunc(String nMsg) 
{ 
Message tMsg=new Message () ; 
Bundle tBundle=new Bundle () ; 
tBundle.putString("CMD", nMsg); 
tMsg.setData (tBundle) ; 
mHandler.sendMessage (tMsg) ; 


public class zipThread implements Runnable 


{ 


GOverride 
public void run() 


{ 


myJni("Eagle is great"); 


class MainHandler extends Handler 


{ 
public MainHandler () {} 
public MainHandler (Looper L) 


{ 
super (L) ; 
} 
public void handleMessage (Message nMsg) 
{ 
super. handleMessage (nMsg) ; 
Bundle tBundle=nMsg.getData() ; 
String tCmd=tBundle.getString ("CMD") ; 
EagleUI.this.mTextView.setText (tCmd) ; 
} 
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} 
Q) 再 看 对 应 的 C/C++ 代码 ， 演 示 代 码 如 下 。 


#include <jni.h> 
jclass gJniClass; 
jmethodID gJinMethod; 


JNIEXPORT jstring JNICALL 
Java eagle test EagleUI myJni(JNIEnv* env, jclass cls,jstring param) 
{ 

char tChar [256]; 

const char *tpParam; 

gJniClass = cls; 

gJinMethod = 0; 
gJinMethod= (*env) ->GetStaticMethodID (env, gJniClass, "myCallbackFunc", " (Ljava/lang/Str 
ing;) V"); 

if (gJinMethod == 0 || gJinMethod == NULL) 

return (*env)->NewStringUTF (env, "-2"); 

strcpy (tChar, "Hello Eagle"); 

(*env) -»CallStaticVoidMethod (env, gJniClass,gJinMethod, (*env)->NewStringUTF (env, 
tChar)); 

DisplayCallBack (env, tChar) ; 

tpParam =(*env) ->GetStringUTFChars (env, param, 0) ; 

return param; 


void DisplayCallBack(JNIEnv* env,char nMsg[]) 
{ 

char tChars [256]; 

strcpy (tChars,nMsg) ; 

(*env) -»CallStaticVoidMethod (env, gJniClass,gJinMethod, (*env) -»NewStringUTF (env, 
tChars) ) ; 


} 
11.3.8 使 用 UNI 实现 Java 5 C 之 间 传 递 数 据 


在 接 下 来 的 内 容 中 ， 将 详细 讲解 在 Android 系统 中 使 用 INI 实现 Java 与 C 之 间 传递 数据 的 
过 程 。 通 过 下 面 的 演示 代码 ， 分 别 讲解 了 传递 整形 、 字 符 串 和 数组 在 C 语言 中 处 理 的 方法 。 
(1) 声明 native( 本 地 ) 方 法 ， 例 如 下 面 的 演示 代码 。 
public class DataProvider { 
// 两 个 java 中 的 int 传递 c 语言 ， c 语言 处 理 这 个 相 加 的 逻辑 , 把 相 加 的 结果 返回 给 java 
public native int add(int x ,int y); 
/ [RE —^ java 中 的 字符 串 传递 给 c 语言 ，c 语言 处 理 下 字符 串 ， 处 理 完毕 返回 给 java 
public native String sayHelloInC (string s); 
// 把 一 个 java 中 int 类 型 的 数组 传递 给 c 语言 ，c 语言 里 面 把 数组 的 每 一 个 元 素 的 值 都 增加 5, 
// 然 后 在 把 处 理 完毕 的 数组 ， 返 回 给 java 
public native int[] intMethod(int[] iNum); 


< 图 
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Q) 上 述 本 地 方法 要 在 C 实现 的 头 文件 中 实现 头 文件 可 以 理解 为 要 在 C 中 实现 的 方法 。 其 


中 JENEnv* 代表 的 是 Java 环境 ， 通 过 这 个 环境 可 以 调用 Java 的 方法 ，jobject 表示 哪个 对 象 调 
用 了 这 个 C 语言 的 方法 ，thiz 表示 当前 的 对 象 。 


Q^ 


/* DO NOT EDIT THIS FILE - it is machine generated */ 
#include <jni.h> 
/* Header for class cn itcast ndk3 DataProvider */ 


#ifmdef Included cn itcast ndk3 DataProvider 

#define Included cn itcast ndk3 DataProvider 

#ifdef cplusplus 

extern "c" { 

#endif 

/* 

* Class: cn itcast ndk3 DataProvider 

* Method: add 

* Signature: (II)I 

tf 

JNIEXPORT jint JNICALL Java_cn_itcast_ndk3 DataProvider_add 
(JNIEnv *, jobject, jint, jint); 


/* 

* Class: cn itcast ndk3 DataProvider 

* Method: sayHelloInC 

* Signature: (Ljava/lang/String;)Ljava/lang/String; 

wh 

JNIEXPORT jstring JNICALL Java cn itcast ndk3 DataProvider sayHelloInC 
(JNIEnv *, jobject, jstring); 


/ * 

* Class: cn itcast ndk3 DataProvider 

* Method: intMethod 

* Signature: ([I) [I 

ef 

JNIEXPORT jintArray JNICALL Java cn itcast ndk3 DataProvider intMethod 
(JNIEnv *, jobject, jintArray); 


#ifdef _ cplusplus 


} 

#endif 

#endif 

(3) 在 C 代码 中 除了 要 引用 头 文件 外 ， 还 要 引入 日 志 信息 ， 以 方便 在 C 中 进行 调试 。 
// 引 入 头 文件 


#include "cn itcast ndk3 DataProvider.h" 
#include <string.h> 

// 导 入 日 志 头 文件 

#include <android/log.h> 

// 修 改 日 志 tag 中 的 值 

#define LOG TAG "logfromc" 

// 日 志 显 示 的 等 级 
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#define LOGD(...) ^ android log print(ANDROID LOG DEBUG, LOG TAG, VA ARGS ) 
#define LOGI(...) android log print(ANDROID LOG INFO, LOG TAG, VA ARGS ) 


// uava 中 的 jstring， 转 化 为 c 的 一 个 字符 数组 


char* Jstring2CStr(JNIEnv* env,  jstring jstr) 


{ 
char* rtn = NULL; 
jclass clsstring = (*env) ->FindClass (env, "java/lang/String") ; 
jstring strencode = (*env) ->NewStringUTF (env, "GB2312") ; 
jmethodID mid =  (*env)-» GetMethodID(env,clsstring, 


"getBytes",  "(Ljava/lang/String;) [B"); 
jbyteArray barr=  (jbyteArray) (*env)-»CallObjectMethod (env, jstr,mid, strencode) ; 
// String .getByte("GB2312"); 


jsize alen = (*env)->GetArrayLength (env, barr) ; 

jbyte* ba =  (*env)-»GetByteArrayElements (env,barr,JNI FALSE); 
if(alen > 0) 

{ 

rtn =  (char*)malloc(alen«1); //new  char[alen«1]; "\o" 


memcpy (rtn,ba,alen); 
rtn[alen]-0; 
} 


(*env)-»ReleaseByteArrayElements(env,barr,ba,0); // 释 放 内 存 


return rtn; 


} 


// 处 理 整形 相 加 
JNIEXPORT jint JNICALL Java cn itcast ndk3 DataProvider add 
(JNIEnv * env, jobject obj, jint x, jint y){ 
// 打 印 Java 传递 过 来 的 jstring ; 
LOGI("log from c code "); 
LOGI ("x= %1d",x); 
LOGD ("y= $1d",y); 
return x+y; 


} 


// 处 理 字符 串 追 加 
JNIEXPORT jstring JNICALL Java cn itcast ndk3 DataProvider sayHelloInC 
(JNIEnv * env, jobject obj, jstring str) { 


char* p = Jstring2CStr(env,str); 
LOGI ("%s",p) ; 
char* newstr = "append string"; 


//strceat (dest, sorce) 把 sorce 字符 串 添 加 到 dest 字符 串 的 后 面 
LOGI ("END") ; 
return (*env)-»NewStringUTF(env, strcat (p,newstr)); 


} 


// 处 理 数组 中 的 每 一 个 元 素 
JNIEXPORT jintArray JNICALL Java cn itcast ndk3 DataProvider intMethod 
(UNIEnv * env, jobject obj, jintArray arr){ 
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// 1. 获 取 到 arr 的 大 小 


int len = (*env)-»GetArrayLength(env, arr); 
LOGI("len-$d", len); 


if (len==0) { 
return arr; 


} 

// 取 出 数组 中 第 一 个 元 素 的 内 存 地 址 

jint* p = (*env)-» GetIntArrayElements (env,arr,0); 
int i-0; 

for (;i<len; i++) { 

LOGI ("len=%1d", *(p+i)) ;// 取 出 的 每 个 元 素 

*(p+i) += 5; // 取 出 的 每 个 元 素 加 5 

) 

return arr; 


} 
(4) 编写 Android.mk 文件 ， 演 示 代码 如 下 。 


LOCAL PATH := $(call my-dir) 

include $(CLEAR VARS) 

LOCAL MODULE := Hello 

LOCAL SRC FILES :- Hello.c 

# 增 加 log 函数 对 应 的 log Æ liblog.so libthread db.a 
LOCAL LDLIBS += -llog 

include $(BUILD SHARED LIBRARY) 


(5) 编写 Java 代码 ， 用 于 载 入 动态 库 ， 并 调用 native 代码 。 


static( 


} 


DataProvider dp; 


System. loadLibrary ("Hello") ; 


GOverride 

public void onCreate(Bundle savedInstanceState) { 
super.onCreate (savedInstanceState); 
setContentView(R.layout.main); 
dp = new DataProvider(); 


} 


/ ada 对 应 的 事件 
public void add (View view) { 
// 执 行 C 语 言 处 理 数据 
int result = dp.add(3, 5); 
Toast .makeText (this，" 相 加 的 结果 "+ result，1) .show(); 


} 
(6) 接 下 来 开始 看 在 C 中 回调 Java 方法 ， 首 先 声明 native 方法 : 


public class DataProvider( 
public native void callCcode(); 
public native void callCcodel(); 


Q^ 


第 11 章 JNI 接 口 


public native void callCcode2(); 


/ 1 [C 调用 Java 中 的 空 方法 

public void helloFromJava()( 
System.out.println("hello from java "); 

} 

//c 调用 Java 中 的 带 两 个 int 参数 的 方法 

public int Add(int x,int y){ 
System.out .println(" 相 加 的 结果 为 "+ (x«y)); 
return x+y; 


} 

//C 调用 Java 中 参数 为 string 的 方法 

public void printString(String s) { 
System.out.println("in java code "+ s); 

} 


} 


头 文件 可 以 用 IDK 自 带 的 javah 进行 自动 生成 , 使 用 “javap -s” 命 令 可 以 获取 方法 的 签名 。 


C) C 代码 实现 回调 的 过 程 需要 三 个 步骤 ， 首 先 要 要 获取 某 个 对 象 ， 然 后 获取 对 象 里 
方法 ， 最 后 调用 这 个 方法 。 


#include "cn itcast ndk4 DataProvider.h" 

#include <string.h> 

#include <android/log.h> 

#define LOG TAG "logfromc" 

#define LOGD(...) _ android log print(ANDROID LOG DEBUG, LOG TAG, _ VA ARGS ) 
#define LOGI(...) ^ android log print(ANDROID LOG INFO, LOG TAG, _ VA ARGS ) 


//1. 调 用 Java 中 的 无 参 helloFromJava 方法 
JNIEXPORT void JNICALL Java cn itcast ndk4 DataProvider callCcode 
(JNIEnv * env , jobject obj){ 
// 获取 到 DataProvider 对 象 
char* classname = "cn/itcast/ndk4/DataProvider"; 
jclass dpclazz = (*env)-»FindClass (env,classname); 
if (dpclazz -- 0) { 
LOGI("not find class!"); 
} else 
LOGI ("find class"); 


而 的 


// 第 三 个 参数 和 第 四 个 参数 是 方法 的 签名 ,第 三 个 参数 是 方法 名 ， 第 四 个 参数 是 根据 返回 值 和 参数 生成 的 


// 获 取 到 DataProvider 要 调用 的 方法 
jmethodID methodID = (*env)->GetMethodID (env, dpclazz, "helloFromJava","()V") ; 
if (methodID == 0) { 

LOGI ("not find method!"); 

} else 

LOGI ("find method"); 
// 调 用 这 个 方法 
(*env) ->CallVoidMethod (env, obj,methodID); 


} 


// 2. 调 用 Java 中 的 printstring 方法 传递 一 个 字符 串 
JNIEXPORT void JNICALL Java cn itcast ndk4 DataProvider callCcodel 


«Q 
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RATER Android 虚拟 机 - 


(JNIEnv * env, jobject obj){ 
LOGI("in code"); 
// 获取 到 DataProvider WR 
char* classname = "cn/itcast/ndk4/DataProvider"; 
jclass dpclazz = (*env) ->FindClass (env, classname) ; 
if (dpclazz == 0) { 
LOGI("not find class!"); 
} else 
LOGI("find class"); 
// 获取 到 要 调用 的 method 
jmethodID methodID = 
(*env) ->GetMethodID (env, dpclazz, "printString"," (Ljava/lang/String;)V"); 
if (methodID -- 0) { 
LOGI("not find method!"); 
) eise 
LOGI("find method"); 


// 调 用 这 个 方法 
(*env) ->CallVoidMethod (env，obj,methodID, (*env) -»NewStringUTF (env, "haha") ) ; 


} 


// 3. 调用 Java 中 的 add 方法 ， 传 递 两 个 参数 jint x,y 
JNIEXPORT void JNICALL Java cn itcast ndk4 DataProvider callCcode2 
(JNIEnv * env, jobject obj) { 
char* classname - "cn/itcast/ndk4/DataProvider"; 
jclass dpclazz = (*env)-»FindClass (env, classname); 
jmethodID methodID = (*env)-»GetMethodID (env, dpclazz, "Add","(II)I"); 
(*env)-»CallIntMethod(env, obj,methodID,31,41); 


11.4 Dalvik 虚拟 机 的 INI 测试 函数 


在 Dalvik 虚拟 机 中 提供 了 一 些 INI 的 调用 测试 函数 ， 以 便 确认 INI 的 机 制 是 否 可 以 运行 ， 


函数 jniRegisterSystemMethods0 来 设置 INI 函数 。 


JNI 的 测试 函数 代码 如 下 。 


/* 

* JNI registration 

HI 

staticJNINativeMethodgMethods[] = { 

/*name, signature, funcPtr */ 

{ "emptydniStaticMethodo", "()V", emptydniStaticMethodo }, 

{ "emptyJniStaticMethod6", "(IIIIII)V",emptyJniStaticMethode }, 
{ "emptydniStaticMethodéL", 

" (bjava/lang/String; [Ljava/lang/String; [[I" 


"Ljava/lang/Object ; [Ljava/lang/Object; [[[ [bjava/1ang/Object;) V", 
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emptydniStaticMethodéL }, 


h 
上 述 代码 是 提供 INI 测试 函数 的 接口 和 相关 实现 的 C 函数 入 口 。 


intregister org apache harmony dalvik NativeTestTarget (UNIEnv*env) 


{ 

intresult = jniRegisterNativeMethods (env, 
"org/apache/harmony/dalvik/NativeTestTarget", 
gMethods , NELEM (gMethods) ) ; 


通过 上 述 代码 , 把 INI 调用 接口 设置 到 包 org.apache.harmony.dalvik.NativeTestTarget 中 ,这 
样 在 Java 的 应 用 程序 里 就 可 以 调用 了 。 

if(result != 0) { 

/*print warning, but allow to continue */ 

LOGW("WARNING:NativeTestTarget not registered in"); 


(*env) ->ExceptionClear (env) ; 


) 


return0; 


} 

/* 

* public static voidemptyJniStaticMethod0 () 
* 


* For benchmarks, a do-nothingJNI method with no arguments. 
oi 
staticvoidemptyJniStaticMethod0 (UNIEnv*env, jclassclazz) 


{ 


//This space intentionally left blank. 


由 此 可 见 ， 这 些 系 统 函 数 的 代码 都 是 空 的 结构 ， 没 有 真实 的 代码 运行 就 可 以 用 来 测试 INI 
是 否 可 以 工作 ， 测 试 INT 调用 的 时 间 需 要 多 少 ， 可 以 提供 准确 的 时 间 。 


11.5 总 结 Android 中 JNI 编程 的 一 些 技巧 


经 过 本 章 前 面 内 容 的 学 习 , 在 Android 中 使 用 TNI 技术 的 核心 内 容 介绍 完毕 。 本 节 将 总 结 在 
Android 中 使 用 INI 技术 的 一 些 技巧 。 在 此 首先 要 强调 的 是 ，native 方法 不 但 可 以 传递 Java 的 基 
本 类 型 做 参数 ， 还 可 以 传递 更 复杂 的 类 型 ， 比 如 String、 数 组 ， 甚 至 是 自 定义 的 类 。 这 一 切 都 可 
以 在 文件 jnih 中 找到 答案 。 


11.5.4 传递 Java 的 基本 类 型 


用 过 Java 的 读者 应 该 知道 ，Java 中 的 基本 类 型 包括 boolean, byte. char. short, int, long, 
float, double 等 ， 如 果 用 这 几 种 类 型 做 native 方法 的 参数 ， 当 我 们 通过 javah -jni 生成 .h 文件 时 ， 
只 要 看 一 下 生成 的 .h 文件 ， 就 会 一 清二 楚 ， 这 些 类 型 分 别 对 应 的 类 型 是 jboolean、jbyte、jchar、 
jshort、jint、jlong、jfloat、jdouble。 这 几 种 类 型 几乎 都 可 以 当成 对 应 的 C++ 类 型 来 用 。 
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11.5.2 ”传递 String 参数 


Java 的 String 和 C++ 的 string 是 不 能 对 等 起 来 的 ， 所 以 处 理 起 来 比较 麻烦 。 先 看 一 个 例子 : 


class Prompt { 
// native method that prints a prompt and reads a line 
private native String getLine(String prompt); 
public static void main(String args[]) { 
Prompt p - new Prompt(); 
String input - p.getLine("Type a line: "); 
System.out.println("User typed: " « input); 


} 
static { 

System. loadLibrary ("Prompt"); 
} 


} 
在 这 个 例子 中 ， 我 们 要 实现 如 下 native 方法 : 
String getLine(String prompt); 


此 方法 的 功能 是 读 入 一 个 String 参数 ， 返 回 一 个 String 值 。 
通过 执行 javah -jni 得 到 的 头 文件 的 演示 代码 如 下 : 


#include <jni.h> 
#ifndef _Included_Prompt 
#define _Included_Prompt 
#ifdef _ cplusplus 
extern "C" { 

#endif 

JNIEXPORT jstring JNICALL Java_Prompt_getLine(JNIEnv *env, jobject this, jstring prompt); 
#ifdef _ cplusplus 

} 

#endif 

#endif 


jstring 是 INI 中 对 应 于 String 的 类 型 , 但 是 和 基本 类 型 不 同 的 是 , jstring 不 能 直接 当 作 C++ 


的 string 用 。 如 果 用 如 下 格式 : 


@> 


cout << prompt << endl; 
此 时 编译 器 会 输出 错误 信息 。 
其 实 要 处 理 jstring 有 很 多 种 方式 ， 这 里 只 讲 一 种 我 认为 最 简单 的 方式 ， 看 下 面 的 例子 。 


#include "Prompt.h" 
#include <iostream> 
JNIEXPORT jstring JNICALL Java_Prompt_getLine(JNIEnv *env, jobject obj, jstring prompt) 
{ 

const char* str; 

str = env->GetStringUTFChars (prompt, false) ; 

if (str == NULL) { 

return NULL; /* OutOfMemoryError already thrown */ 


} 
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std::cout << str << std::endl; 
env->ReleaseStringUTFChars (prompt, str); 
char* tmpstr = "return string succeeded"; 
jstring rtstr = env-»NewStringUTF (tmpstr); 
return rtstr; 


} 

在 上 面 的 例子 中 ， 作 为 参数 的 prompt 不 能 直接 被 C++ 程序 使 用 ， 先 实现 了 如 下 转换 。 

str = env-»GetStringUTFChars (prompt, false); 

这 样 将 jstring 类 型 变 成 一 个 char* 类 型 。 

在 返回 的 时 候 ， 要 生成 一 个 jstring 类 型 的 对 象 ， 也 必须 通过 如 下 命令 。 

jstring rtstr = env-»NewStringUTF (tmpstr); 

这 里 用 到 的 GetStringUTFChars 和 NewStringUTF 都 是 JNI 提供 的 处 理 String 类 型 的 函数 ， 
还 有 其 他 的 函数 这 里 就 不 一 一 列举 了 。 


11.5.3 ”传递 数组 类 型 


和 String 一 样 ,JNI JJ Java 基本 类 型 的 数组 提供 了 j*Array 类 型 ,比如 int[] 对 应 的 就 是 jintArray。 
来 看 一 个 传递 nt 数组 的 例子 。 


JNIEXPORT jint JNICALL Java IntArray sumArray(JNIEnv *env, jobject obj, jintArray arr) 


jint *carr; 
carr - env-»GetIntArrayElements(arr, false); 
if(carr -- NULL) { 
return 0; /* exception occurred */ 
} 


jint sum = 0; 

for(int i=0; i<10; i++) { 
sum += carr[i]; 

} 


env-»ReleaseIntArrayElements (arr, carr, 0); 
return sum; 
} 
在 上 述 代 码 中 , 函数 GetIntArrayElements() fil ReleaseIntArrayElements() sz JNI 提供 用 于 处 理 
int 数组 的 函数 。 如 果 试 图 用 art 自 的 方式 去 访问 jintArray 类 型 ， 毫 无 疑问 会 出 错 。JNI 还 提供 了 
另 一 对 函数 GetIntArrayRegion0 和 ReleaseIntArrayRegion()ijj [a] int 数组 ， 在 此 就 不 介绍 了 ， 对 
于 其 他 基本 类 型 的 数组 ， 方 法 类 似 。 


11.5.4 ”二 维 数组 和 String 数组 


在 JNI 中 ， 二 维 数组 和 String 数组 都 被 视 为 object 数组 。 下 面 仍 然 用 一 个 例子 来 说 明 ， 这 
次 是 一 个 二 维 int 数组 ， 作 为 返回 值 。 


JNIEXPORT jobjectArray JNICALL Java ObjectArrayTest initInt2DArray (UNIEnv *env, jclass 
cls, int size) 
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jobjectArray result; 
jclass intArrCls = env-»FindClass("[I"); 
result - env-»NewObjectArray (size, intArrCls, NULL); 
for (int i = 0; i < size; i++) { 
jint tmp[256]; /* make sure it is large enough! */ 
jintArray iarr = env-»NewIntArray (size); 
for(int j = 0; j < size; j++) { 
tmp[j]] = i+ j; 
} 
env->SetIntArrayRegion(iarr, 0, size, tmp); 
env->SetObjectArrayElement (result, i, iarr); 
env->DeleteLocalRef (iarr) ; 
} 
return result; 
} 


上 面 代码 中 的 第 三 行 : 

jobjectArray result; 

因为 要 返回 值 ， 所 以 需要 新 建 一 个 jobjectArray 对 象 。 

jclass intArrCls = env-»FindClass("[I"]; 

这 样 做 的 目的 是 创建 一 个 jclass 的 引用 ,因为 result 的 元 素 是 一 维 int 数 组 的 引用 ,所 以 intArrCls 
必须 是 一 维 int 数组 的 引用 ， 这 一 点 是 如 何 保证 的 呢 ? 注意 FindClass 的 参数 "[I"，JNI 就 是 通过 
它 来 确定 引用 的 类 型 的 ，I 表 示 是 int 类 型 ，[ 标 识 是 数组 。 对 于 其 他 的 类 型 ， 都 有 相应 的 表示 
方法 。 

: boolean 
: byte 

: char 

: short 
int 

long 

: float 
D: double 

String 是 通过 “Ljava/lang/String; "表示 的 , 那 相应 的 String 数组 就 应 该 是 “[Ljava/lang/String: ”。 
继续 回 到 上 述 代码 ， 下 面 代码 的 作用 是 为 result 分 配 空间 。 


result = env-»NewObjectArray(size, intArrCls, NULL); 


下 面 代码 的 作用 是 为 一 维 int 数组 iarr 分 配 空 间 。 
jintArray iarr = env-»NewIntArray (size); 

下 面 代码 的 作用 是 为 iarr 赋值 。 
env-»SetIntArrayRegion(iarr, 0, size, tmp); 


代码 的 作用 是 为 result 的 第 i 个 元 素 赋值 。 


oooooooono 
BS Uy iN 


Q^ 
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env-»SetObjectArrayElement (result, i, iarr); 
通过 上 述 步骤 ， 就 创建 了 一 个 二 维 int 数组 ， 并 赋值 完毕 ， 这 样 就 可 以 做 为 参数 返回 了 。 
如 果 了 解 了 上 面 介绍 的 这 些 内 容 ， 基 本 上 可 以 完成 大 部 分 的 任务 了 。 虽 然 在 操作 数组 类 型 ， 
尤其 是 二 维 数组 和 String 数组 的 时 候 ， 比 起 在 单独 的 语言 中 编程 要 麻烦 ， 但 既然 我 们 享受 了 跨 
语言 编程 的 好 处 ， 必 然 要 付出 一 定 的 代价 。 
在 此 有 一 点 要 补充 的 是 ， 上 面 用 到 的 函数 调用 方式 都 是 针对 C++ 的 。 如 果 要 在 C 环境 中 使 
Hl. 所 有 的 env-> 都 要 被 蔡 换 成 (*env)->, 而 且 后 面 的 函数 中 需要 增加 一 个 参数 env, 具体 可 参看 
文件 jnih 的 代码 。 另 外 还 有 些 省 略 的 内 容 ， 可 以 参考 JNI 的 文档 : Java Native Interface 6.0 
Specification， 这 内 容 在 IDK 的 文档 里 就 可 以 找到 。 如 果 要 进行 更 深入 的 INI 编程 ， 需 要 仔细 阅 
读 这 个 文档 。 在 接 下 来 的 高 级 篇 ， 也 会 讨论 更 深入 的 话题 。 
关于 JNI 编程 更 深入 的 话题 ， 包 括 在 native 方法 中 访问 Java 类 的 域 和 方法 ， 将 Java 中 自 定 
义 的 类 作为 参数 和 返回 值 传递 等 。 了 解 这 些 内 容 ， 将 会 对 INI 编程 有 更 深入 的 理解 ， 写 出 的 程 
序 也 更 清晰 ， 易 用 性 更 好 。 
(1) 在 一 般 的 Java 类 中 定义 native 方法 
在 签名 档 演示 代码 中 ， 都 是 将 native 方法 放 在 main 方法 的 Java 类 中 ,实际 上 ,完全 可 以 在 
任何 类 中 定义 native 方法。 这 样 ， 对 于 外 部 来 说 ， 这 个 类 和 其 他 的 Java 类 没有 任何 区 别 。 
Q) 访问 Java 类 的 域 和 方法 
native 方法 虽然 是 native 的 ， 但 毕竟 是 方法 ， 那 么 就 应 该 同 其 他 方法 一 样 ， 能 够 访问 类 的 私 
有 域 和 方法 。 实 际 上 ，JNI 的 确 可 以 做 到 这 一 点 ， 我 们 通过 几 个 例子 来 说 明 。 
public class ClassR { 
String str = "abcde"; 
int number ; 
public native void nativeMethod() ; 
private void javaMethod() { 
System.out.println("call java method succeeded"); 


} 
static { 
System. loadLibrary ("ClassA") ; 


} 


} 
在 这 个 例子 中 , 我 们 在 一 个 没有 main 方法 的 Java 类 中 定义 了 native 方法 。 我们 将 演示 如 何 
在 nativeMethod0 中 访问 域 sr_、number_ 和 方法 javaMethod0、nativeMethodO 的 C++ 实现 如 下 。 


JNIEXPORT void JNICALL Java testclass ClassCallDLL nativeMethod (JNIEnv *env, jobject obj) 
{ 

// access field 

jclass cls = env->GetObjectClass (obj) ; 

jfieldID fid = env-»GetFieldID(cls, "str ", "Ljava/lang/String;"); 

jstring jstr - (jstring)env-»GetObjectField(obj, fid); 

const char *str - env-»GetStringUTFChars(jstr, false); 

if(std::string(str) -- "abcde") 

Std::cout «« "access field succeeded" «« std::endl; 
jint i - 2468; 
fid - env-»GetFieldID(cls, "number ", "I"); 
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env->SetIntField(obj, fid, i); 
// access method 
jmethodID mid = env->GetMethodID(cls, "javaMethod", "()V"); 
env->CallVoidMethod (obj, mid); 
} 
在 上 述 代 码 中 ， 通 过 如 下 两 行 代码 获得 str_ 的 值 。 
jfieldID fid = env-»GetFieldID(cls, "str ", "Ljava/lang/String;"); 
jstring jstr - (jstring)env-»GetObjectField(obj, fid); 
上 述 第 一 行 代码 用 于 获得 str 的 id， 在 函数 GetFieldIDO 的 调用 中 需要 指定 str_ 的 类 型 ， 第 
二 行 代 码 通过 str_ 的 id 获得 它 的 值 ， 当 然 我 们 读 到 的 是 一 个 jstring 类 型 ， 并 不 能 直接 显示 ， 而 
是 需要 转化 为 char* 类 型 。 
接 下 来 我 们 看 如 何 给 Java 类 的 域 赋 值 ， 看 下 面 两 行 代码 : 
fid = env-»GetFieldID(cls, "number ", "I"); 
env-»SetIntField(obj, fid, i); 
其 中 第 一 行 代 码 同 前 面 一 样 ， 用 于 获得 number 的 id， 第 二 行 我 们 通过 函数 SetIntField0 将 
i 的 值 赋 给 number ， 其 他 类 似 的 函数 可 以 参考 IDK 的 文档 。 
访问 javaMethodO 的 过 程 同 访问 域 类 似 ， 代 码 如 下 。 
jmethodID mid = env-»GetMethodID(cls, "javaMethod", "()V"); 
env-»CallVoidMethod(obj, mid); 
在 此 需要 强调 的 是 ， 在 GetMethodID 中 ， 我 们 需要 指定 javaMethod 方法 的 类 型 ， 域 的 类 型 
很 容易 理解 ， 方 法 的 类 型 如 何 定义 呢 ， 在 上 面 的 例子 中 用 OV，V 表示 返回 值 为 室 ，0 表 示 参 数 
为 室 。 如 果 是 更 复杂 的 函数 类 型 如 何 表示 ? 看 下 面 的 代码 。 


long f (int n, String s, int[] arr); 


这 个 函数 的 类 型 符号 是 (ILjava/lang/String:[DJ，I 表 示 int 2579, Ljava/lang/String; 7r String 
FAM, [I 表示 int BH, J 表示 long。 这 些 都 可 以 在 文档 中 查 到 。 

(3) 在 native 方法 中 使 用 用 户 定义 的 类 

JNI 不 仅 能 使 用 Java 的 基础 类 型 ， 还 能 使 用 用 户 定义 的 类 ， 这 样 灵 活性 就 大 多 了 。 大 体 上 
使 用 自 定 义 的 类 和 使 用 Java 的 基础 类 (比如 String) 没 有 太 大 的 区 别 ， 关 键 的 一 点 是 ， 如 果 要 使 
用 自 定义 类 , 首先 要 能 访问 类 的 构造 函数 。 下 面 这 一 段 代 码 在 native 方法 中 使 用 了 自 定 义 的 Java 
类 ClassB。 

jclass cls = env->FindClass("Ltestclass/ClassB;") ; 

jmethodID id = env->GetMethodID(cls, "<init>", "(D)V"); 

jdouble dd = 0.033; 

jvalue args [1]; 

args[0].d = dd; 

jobject obj = env->NewObjectA(cls, id, args); 

首先 要 创建 一 个 自 定义 类 的 引用 , 通过 FindClass 函数 来 完成 ,参数 同 前 面 介 绍 的 创建 String 
对 象 的 引用 类 似 ， 只 不 过 类 名 称 变 成 自 定义 类 的 名 称 。 然 后 通过 GetMethodID 函数 获得 这 个 类 
的 构造 函数 ， 注 意 这 里 方法 的 名 称 是 "<init>"， 它 表示 这 是 一 个 构造 函数 。 


jobject obj = env-»NewObjectA(cls, id, args); 
9» 
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这 样 便 生成 了 一 个 ClassB 的 对 象 ，args 是 ClassB 的 构造 函数 的 参数 ， 是 jvalue* 类 型 。 

通过 以 上 介绍 的 三 部 分 内 容 ，native 方法 已 经 看 起 来 完全 像 Java 自己 的 方法 了 ， 至 少 在 主 
要 功能 上 是 齐备 了 ， 只 是 实现 上 稍 麻烦 。 而 了 解 了 这 些 ， 读 者 用 INI 编程 的 水 平 也 会 更 上 一 层 
楼 。 下 面 要 讨论 的 话题 也 是 一 个 重要 内 容 ， 至 少 如 果 没有 它 ， 我 们 的 程序 只 能 停留 在 演示 阶段 ， 
不 具有 实用 价值 。 

(4) 异常 处 理 

在 C++ 和 Java 的 编程 中 , 异常 处 理 都 是 一 个 重要 的 内 容 。 但 是 在 TNI 中 , 麻烦 就 来 了 , native 
方法 是 通过 C++ 实现 的 ， 如 果 在 native 方法 中 发 生 了 异常 ， 如 何 传导 到 Java WE? INI 提供 了 实 
现 这 种 功能 的 机 制 。 我 们 可 以 通过 下 面 这 段 代码 抛 出 一 个 Java 可 以 接收 的 异常 ， 

jclass errCls; 

env->ExceptionDescribe () ; 

env-»ExceptionClear(); 

errCls = env-»FindClass("java/lang/IllegalArgumentException") ; 

env-»ThrowNew(errCls, "thrown from C++ code"); 

如 果 要 抛 出 其 他 类 型 的 异常 ， 蔡 换 掉 FindClass 的 参数 即 可 。 这 样 在 Java 中 就 可 以 接收 到 
native 方法 中 抛 出 的 异常 。 
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从 Android 2.2 版 本 开始 , Dalvik 虚拟 机 新 增 了 JIT 编译 器 , 此 编译 器 能 提高 Android 上 Java 
程序 的 性 能 。 本 章 将 详细 讲解 TIT 编译 器 的 基本 知识 ， 为 读者 步 入 本 书后 面 知识 的 学 习 打 下 
基础 。 


12.1 JIT 简介 


本 节 将 简要 介绍 JIT 技术 的 基本 知识 ， 为 读者 步 入 本 书后 面 知识 的 学 习 打下 基础 。 


12.1.1 JIT 概述 


Google 公司 声称 : 自从 Android 虚拟 机 Dalvik 使 用 了 JIT 技术 后 ,使 其 运行 速度 快 了 5 fi. 
Dalvik 虚拟 机 解释 并 执行 程序 ，JIT 技术 主要 是 对 多 次 运行 的 代码 进行 编译 ， 当 再 次 调用 时 使 用 
编译 后 的 机 器 码 ， 而 不 是 每 次 都 解释 ， 以 节约 时 间 。5 倍 是 测试 程序 测 出 的 值 ， 并 不 是 说 程序 的 
运行 速度 也 能 达到 5 倍 ， 这 是 因为 测试 程序 有 很 多 的 重复 调用 和 循环 ， 而 一 般 程序 的 主要 是 顺 
序 执行 的 ， 而 且 它 是 一 边 运行 ， 一 边 编译 ， 一 开始 的 时 候 提 速 不 多 ， 所 以 真正 运行 程序 速度 的 
提高 并 不 是 特别 明显 。 

JIT 的 全 称 是 just-in-time compilation， 是 对 代码 的 动态 编译 /翻译 。JIT 编译 器 是 一 个 tracing 
JIT(IEI trace-based JID， 主 要 以 “tace” 为 单位 来 决定 要 编译 的 内 容 ; 目前 也 同时 支持 以 整个 


文本 形式 的 源码 ， 不 过 更 常见 的 是 字 节 码 或 者 BLA 
的 机 器 指令 。 
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一 般 就 是 说 在 某 个 函数 /方法 (也 可 能 是 别 的 编译 单元 ) 初 次 执行 时 就 对 它 进行 编译 ， 生 成 的 目标 
代码 刚好 赶 上 该 函数 /方法 的 执行 。 而 现在 的 一 些 混合 执行 模式 的 虚拟 机 /动态 编译 系统 中 ， 函 数 
/方法 或 许 一 开始 是 在 解释 器 里 执行 的 ， 等 一 阵子 才 会 被 动态 编译 ， 按 原本 “JIT” 的 意思 来 说 就 
已 经 太 迟 了 ， 并 不 是 “刚好 赶 上 ”， 不 过 IT 更 多 的 已 经 成 为 一 种 惯用 称谓 ， 也 就 不 必 那 么 在 
意 这 个 小 细节 。 

JIT 编译 器 是 一 个 连续 体 ， 一 端 是 编译 速度 非常 快 ， 但 只 能 生成 质量 一 般 的 代码 的 编译 器 ; 
另 一 端 是 编译 速度 较 慢 ， 而 生成 高 度 优化 代码 的 编译 器 。 

JIT 编译 器 可 以 分 为 许多 小 类 别 ， 最 简单 的 一 类 快速 JIT 编译 器 可 以 是 基于 模板 的 ， 也 就 是 
每 个 字 节 码 对 应 一 个 固定 的 目标 代码 模式 。 所 谓 “编译” 是 指 在 这 种 JIT 编译 器 中 ， 简 单 地 根 
据 源 程序 把 预 置 的 模板 串 在 一 起 的 过 程 。 整 个 过 程 基本 上 不 对 代码 做 分 析 工 作 ， 也 不 做 优化 工 
作 。 解 释 器 也 是 一 个 连续 体 ， 从 最 简单 、 最 慢 的 行 解释 器 到 相对 高 速 的 context-threading . 
inline-threading 等 。 高 速 的 解释 器 与 基于 模板 的 JIT 编译 器 正好 接 上 ， 都 会 在 运行 时 生成 新 的 目 
标 代 码 用 于 执行 用 户 程序 。 所 以 把 视野 再 放 开 一 点 的 话 ， 从 解释 器 到 动态 编译 器 也 构成 了 一 个 
连续 体 。 解 释 器 与 动态 编译 器 的 分 水 岭 ， 在 于 用 户 程序 中 的 指令 分 派 (instruction dispatch) 451 4X 
件 来 做 还 是 直接 由 硬件 实现 。 一 个 解释 器 如 果 优化 到 完全 消除 了 用 户 程序 的 指令 分 派 在 软件 一 
侧 的 开销 ， 就 可 以 称 之 为 编译 系统 了 。 

在 一 个 从 Java 源码 编译 到 JVM 字 节 码 的 编译 器 (如 javac、ECJ) 的 过 程 中 , 一 个 “编译 单元 ” 
(CompilationUnit) 指 的 是 一 个 Java 源 文件 .而 在 Dalvik VM 的 JIT 中 也 有 一 个 名 为 'CompilationUnit” 
的 结构 体 ， 这 个 千 万 不 能 跟 Java 源码 级 的 编译 单元 弄 混 了 一 一 它 在 这 里 指 的 就 是 一 个 “trace”。 

许多 早期 的 JIT 编译 器 以 “函数 ”或 者 “方法 ”为 单位 进行 编译 ， 并 通过 函数 /方法 内 联 来 
降低 调用 成 本 、 扩 大 优化 的 作用 域 。 但 一 个 函数 /方法 中 也 可 能 存在 热 路 径 与 冷 路 径 的 区 别 ， 如 
果 以 函数 /方法 为 粒度 来 编译 ， 很 可 能 会 在 冷 路 径 上 浪费 了 编译 的 时 间 和 空间 ， 却 没有 得 到 执行 
速度 的 提升 .为 此 许多 JIT 编译 器 会 记录 方法 内 分 支 的 执行 频率 , 在 JIT 编译 时 只 对 热 路 径 编译 ， 
将 冷 路 径 生 成 为 “uncommon trap ”， 等 真 的 执行 到 冷 路 径 时 跳 回 到 解释 器 或 其 他 备用 实行 方式 
继续 。 

Tracing JIT 能 够 更 简单 有 效 的 获取 到 涉及 循环 的 热 代码 中 的 执行 路 径 ， 该 编译 器 的 中 间 表 
示 分 为 两 种 ， 分 别 是 MIR(middle-level intermediate representation) 与 LIR(low-level intermediate 
representation). MIR 与 LIR 节点 各 自 形成 链表 , 分 别 被 组 织 在 BasicBlock 与 ConpilationUnit 中 。 
有 具体 编译 流程 如 下 。 

(1) 创建 CompilationUnit 对 象 来 存放 一 次 编译 中 需要 的 信息 。 

(2) 将 dex 文件 中 的 Dalvik 字 节 码 解码 为 DecodedInstruction， 并 创建 对 应 的 MIR 节点 。 

G) 定位 基本 块 的 边界 ， 并 创建 相应 的 BasicBlock 对 象 ， 将 MIR 塞 进去 。 

(4) 确定 控制 流 关 系 ,将 基本 块 连接 起 来 构成 控制 流 图 (CFG)， 并 添加 恢复 解释 器 状态 和 异 
常 处 理 用 的 基本 块 。 

(5) 将 基本 块 都 加 到 CompilationUnit 里 去 。 

(6) 将 MIR 转换 为 LIR( 带 有 局 部 优化 和 全 局 优化 )。 

(7) 从 LIR 生成 机 器 码 。 

从 上 述 编译 流程 来 看 ， 真 正 与 CPU 架构 相关 的 是 步骤 (3) 一 (7) 个 ， 因 为 LIR 是 与 CPU 密切 
相关 的 汇编 级 指令 集 。 而 步骤 (0) 一 (9D) 则 是 dex 字 节 码 到 MIR 的 转换 ， 可 以 视 为 JIT 中 与 CPU 
架构 无 关 的 部 分 。 因 此 ， 将 JIT 移植 到 一 个 新 的 架构 上 去 ， 应 该 模拟 实现 一 套 LIR 指令 集 ， 以 
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及 重新 现实 对 LR 指令 进行 处 理 的 函数 。 这 里 ， 工 作 量 集中 体现 在 compiler/codegen/ 
TARGET_ARCH/， 可 以 从 MIPS 中 代码 中 看 到 移植 该 部 分 的 工作 量 (C 代码 )。 另 外 ， 从 上 述 分 
析 的 相关 的 汇编 也 是 工作 量 的 一 部 分 。 

Dalvik 虚拟 机 的 运行 流程 ( 含 ID 如 图 12-1 所 示 。 


Dalvik Trace JIT Flow 


Translation Cache 


12-1 Dalvik 虚拟 机 的 运行 流程 


要 想 让 Java 程序 能 够 在 Android 上 运行 ， 在 由 源码 编译 为 JVM 字 节 码 后 ， 还 需要 经 过 dx 
的 处 理 ， 从 Java 虚拟 机 字 节 码 转换 为 Dalvik 虚拟 机 字 节 码 。dx 在 转换 过 程 中 已 经 做 过 一 些 优化 
了 ， 所 以 可 以 理解 为 什么 Dalvik 虚拟 机 中 的 JIT 在 MIR 层面 基本 上 没 做 优化 。 

不 过 现在 的 Dalvik 虚拟 机 的 JIT 的 完成 度 还 很 低 ， 局 部 优化 只 有 宛 余 load/store 消除 ,全 局 
优化 只 有 宛 余 分 支 消除 。dx 本 身 并 没有 做 像 是 循环 不 变量 外 提 之 类 的 优化 ， 所 以 就 算 有 了 JIT, 
Dalvik 虚拟 机 生成 出 来 的 代码 质量 也 不 会 很 好 ， 目 前 能 看 到 的 最 明显 的 效果 只 是 把 解释 器 中 指 
令 分 派 的 开销 给 消除 掉 了 而 已 。 


12.1.2. Java 虚拟 机 主要 的 优化 技术 


a) nT 

JIT 最 开始 是 指 在 执行 前 编译 ， 但 是 到 现在 已 经 发 展 成 为 ， 一 开始 解释 执行 ， 只 有 被 多 次 调 
用 的 程序 段 才 被 编译 ， 编 译 后 存放 在 内 存 中 ， 下 次 直接 执行 编译 后 的 机 器 码 。 

Q method 方式 :以 函数 或 方法 为 单位 进行 编译 。 

口 trace 方式 : 以 trace 为 单位 进行 编译 (可 以 把 循环 中 的 内 容 作为 单位 编译 )， 此 方法 也 包 

含 method。 

(2) AOT(Ahead Of Time) 

在 程序 下 载 到 本 地 时 就 编译 成 机 器 码 ， 并 存储 在 本 地 存在 硬盘 上 ， 以 加 快运 行程 度 ， 用 此 
种 方式 ， 可 执行 的 程序 会 变 大 四 五 倍 。 


Q^ 
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12.1.3 Dalvik 虚拟 机 中 JIT 的 实现 


每 启动 一 个 应 用 程序 ， 都 会 相应 地 启动 一 个 Dalvik 虚拟 机 ， 启 动 时 会 建立 JIT 线程 ， 该 线 
程 会 一 直 在 后 台 运行 。 当 某 段 代码 被 调用 时 ， 虚 拟 机 会 判断 它 是 否 需 要 编译 成 机 器 码 ， 如 果 需 
要 ， 就 做 一 个 标记 ，JIT 线程 不 断 地 判断 此 标记 ， 如 果 发 现 被 设 定 就 把 它 编译 成 机 器 码 ， 并 将 其 
机 器 码 地 址 及 相关 信息 放 入 entry table 中 , 下 次 执行 到 此 就 跳 到 机 器 码 段 执行 , 而 不 再 解释 执行 ， 
从 而 提高 了 应 用 程序 的 运行 速度 。 


12.2 Dalvik 虚拟 机 对 JIT 的 支持 


为 了 对 JIT 编译 器 提供 良好 的 支持 ， 在 Dalvik 虚拟 机 原本 的 解释 器 里 进行 了 相应 的 修改 ， 
添加 了 新 的 方法 入 口 和 profile 处 理 。 例 如 在 文件 vm/mterp/armvSte/header.S 中 添加 了 如 下 粗 体 
代码 ， 这 表示 新 添加 了 一 些 宏 。 

#define GOTO OPCODE( reg) add pc, rIBASE, reg, lsl #${handler_size bits} 


#define GOTO OPCODE IFEQ( reg) addeq pc, rIBASE, reg, lsl #${handler size bits) 
#define GOTO OPCODE IFNE( reg) addne pc, rIBASE, reg, lsl #${handler_size bits} 


/* 

* Get/set the 32-bit value from a Dalvik register. 

vii 

#define GET VREG( reg, vreg) ldr .reg, [rFP, _vreg, lsl #2] 
#define SET VREG( reg, vreg) str .reg, [rFP, _vreg, lsl #2] 


#if defined(WITH JIT) 


#define GET JIT ENABLED( reg) ldr reg, [rGLUE,soffGlue jitEnabled] 
#define GET JIT PROF TABLE( reg) ldr reg, [rGLUE, #offGlue_pJitProfTable] 
#endif 


并 且 在 一 些 指令 的 处 理 代码 中 也 有 对 它 的 应 用 ， 例 如 下 面 的 比较 指令 。 


sverify "branch taken" 
sverify "branch not taken" 
/* 


* Generic two-operand compare-and-branch operation. Provide a "revcmp" 


* fragment that specifies the *reverse* comparison to perform, e.g. 
* for "if-le" you would use "gt" . 

* 

* For: if-eq, if-ne, if-lt, if-ge, if-gt, if-le 

ay} 

/* if-cmp vA, vB, +CCCC */ 

mov r0, rINST, lsr #8 @ 0<- A+ 

mov ri, riNST, ler #12 @ Il<- B 

and r0, rO, #15 

GET VREG(r3, r1) @ r3«- vB 

GET_VREG(r2, r0) @ r2<- vA 

mov r9, #4 @ r0<- BYTE branch dist for not-taken 
cmp t2; x3 @ compare (vA, vB) 
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b${revemp} 1f @ branch to 1 if comparison failed 
FETCH S(r9, 1 ) @ r9<- branch offset, in code units 
movs r9, r9, asl #1 @ convert to bytes, check sign 

bmi common backwardBranch yes, do periodic checks 


1: 
#if defined (WITH JIT) 
GET JIT PROF TABLE (r0) 


FETCH ADVANCE INST RB(r9) @ update rPC, load rINST 
b common testUpdateProfile 
#else 
FETCH_ADVANCE_INST_RB(r9) update rPC, load rINST 
GET_INST_OPCODE (ip) @ extract opcode from rINST 
GOTO_OPCODE (ip) @ jump to next instruction 
#endif 
并 且 在 文件 vm/interp/InterpDefs.h 中 ， 新 添加 了 如 下 对 方法 入 口 的 注释 。 


* There are six entry points from the compiled code to the interpreter: 

* 1) dvmJitToInterpNormal: find if there is a corresponding compilation for 
* the new dalvik PC. If so, chain the originating compilation with the 

* target then jump to it. 

* 2) dvmJitToInterpInvokeNoChain: similar to 1) but don't chain. This is 

* for handling 1-to-many mappings like virtual method call and 

* packed switch. 

* 3) dvmJitToInterpPunt: use the fast interpreter to execute the next 

* instruction(s) and stay there as long as it is appropriate to return 

* to the compiled land. This is used when the jit'ed code is about to 

* throw an exception. 

* 4) dvmJitToInterpSingleStep: use the portable interpreter to execute the 
* next instruction only and return to pre-specified location in the 

* compiled code to resume execution. This is mainly used as debugging 

* feature to bypass problematic opcode implementations without 

* disturbing the trace formation. 

* 5) dvmJitToTraceSelect: if there is a single exit from a translation that 
* has already gone hot enough to be translated, we should assume that 

* the exit point should also be translated (this is a common case for 

* invokes). This trace exit will first check for a chaining 

* opportunity, and if none is available will switch to the debug 

* interpreter immediately for trace selection (as if threshold had 

* just been reached). 

* 6) dvmJitToPredictedChain: patch the chaining cell for a virtual call site 
* to a predicted callee. 

zy 


mterp 解释 器 的 统一 方法 入 口 是 dvmMterpStdRun(). 这 个 方法 入 口 在 mterp 的 平台 相关 代码 
的 entry.S 里 定义 。 


12.3 ”汇编 代码 和 改动 


本 节 将 简要 讲解 TIT 汇编 代码 的 内 容 和 对 C 文件 的 改动 过 程 ， 为 读者 步 入 本 书后 面 知识 的 
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学 习 打 下 基础 。 


12.3.1 汇编 部 分 代码 
与 架构 相关 的 编译 模板 文件 如 下 。 


/template/out /Compiler/TemplateAsm-unicore32S.S 


该 文件 的 内 容 比较 多 ， 工 作 量 比较 大 。 文 件 TemplateAsm-unicore32S.S 会 产生 脚本 ， 主 要 
工作 量 体 现在 生产 该 文件 的 源 文件 ， 源 码 目录 如 下 。 


/dalvik/vm/compiler/template 


该 部 分 内 容 的 处 理 与 mterp 解释 器 中 汇编 的 处 理 方式 相似 ， 用 一 个 脚本 把 所 有 汇编 内 容 汇 
集 到 一 个 文件 中 。 
再 看 如 下 目录 。 


dalvik/vm/mterp/##ARCH##/ 


该 目录 是 解释 器 的 实现 ， 因 为 JIT 与 解释 器 并 不 是 独立 工作 的 ， 因 此 解释 器 中 有 不 少 针 对 
JIT 状态 处 理 的 函数 ， 代 码 块 使 用 ##f defined(WITH JIT) 来 控制 。 代 码 量 主要 体现 在 文件 
footer.S 中 。 


12.3.2 对 C 文件 的 改动 


JIT 对 C 代码 的 改动 有 很 多 ， 其 中 主要 集中 有 如 下 几 个 文件 。 
ArchUtility.c. 

Assemble.c. 

CodegenDriver.c. 

MipsLIR.h( 重 写 )。 

MipsFP.c( 重 写 )。 

RallocUtilc 。 

这 些 改动 是 MIPS 对 JIT 的 优化 ， 与 MIPS 架构 是 紧密 相连 的 。 从 架构 上 看 ，UNICORE 与 
ARM 的 架构 比较 相近 ， 但 IT 中 有 大 量 的 16 位 Thumb 指令 。MIPS 指令 长 度 为 32 位 ， 但 架构 
相似 度 较 低 。 

MIPS 可 借鉴 的 是 compiler 模拟 32 位 指令 集 的 工作 量 评估 及 后 期 移植 指导 。 在 MIPS 代码 
中 使 用 了 大 量 的 assert0， 初 步 判 断 为 调试 所 用 ， 在 移植 过 程 中 可 以 借鉴 这 些 调试 点 。 

从 注释 和 数据 命名 特征 分 析 ，MIPS 是 以 ARM 为 原型 对 JIT 进行 的 移植 ， 移 植 过 程 中 加 入 
了 MIPS 架构 的 特殊 , 鉴于 UNICORE 架构 与 ARM 架构 的 相近 性 , 初步 调研 结果 为 以 参考 ARM 
为 主 ， 借 鉴 MIPS 为 辅 对 JIT 进行 移植 ， 认 真 阅读 每 一 行 注释 ， 仔 细 推 项 每 个 函数 命名 。 


OOOOODO 


124 Dalvik 虚拟 机 中 的 源码 分 析 
在 Dalvik 虚拟 机 的 vmmterp 目录 下 ， 保 存 了 和 JIT 编译 相关 的 核心 源码 。 本 节 将 简要 分 析 


«Q 
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Dalvik 虚拟 机 中 的 JIT 源码 ， 为 读者 步 入 本 书后 面 知识 的 学 习 打 下 基础 。 


12.4.1 


入 口 文件 


首先 看 文件 vnyinterp 人 itc, 此 文件 提供 了 外 界 调用 的 入 口 。 接 下 来 开始 分 析 这 个 文件 的 源码 。 
(1) 函数 dvmJitStartup(void)， 用 于 创建 JIT 编译 ， 为 编译 工作 做 好 准备 。 主 要 代码 如 下 。 


int dvmJitStartup (void) 


{ 


unsigned int i; 
bool res - true; /* Assume success */ 


// 开始 创建 编译 器 */ 
res &= dvmCompilerStartup(); 


dvmInitMutex (&gDvmJit .tableLock) ; 
if (res && gDvm.executionMode == kExecutionModeJit) { 


done: 


JitEntry *pJitTable - NULL; 
unsigned char *pJitProfTable - NULL; 
assert (gDvm.jitTableSize && 

!(gDvm.jitTableSize & (gDvmJit.jitTableSize - 1))); // Power of 2? 
dvmLockMutex (&gDvmJit.tableLock); 
pJitTable = (JitEntry*) 

calloc(gDvmJit.jitTableSize, sizeof (*pJitTable)); 

if (!pJitTable) { 

LOGE("jit table allocation failed\n") ; 

res - false; 

goto done; 


NOTE: 该 文件 表 必 须 只 分 配 一 次 ， 在 全 局 范围 内 . 

Profiling is turned on and off by nulling out gDvm.pJitProfTable 
and then restoring its original value. However, this action 

is not syncronized for speed so threads may continue to hold 
and update the profile table after profiling has been turned 
off by null'ng the global pointer. Be aware. 


*o* ox ox o 


su 
pJitProfTable = (unsigned char *)malloc(JIT PROF SIZE); 
if (!pJitProfTable) { 
LOGE ("jit prof table allocation failed in"); 
res - false; 
goto done; 
} 
memset (pJitProfTable,0,JIT_PROF_SIZE) ; 
for (i-0; i < gDvmJit.jitTableSize; i++) { 
pJitTable[i].u.info.chain = gDvmJit.jitTableSize; 
} 
/* Is chain field wide enough for termination pattern? */ 
assert (pJitTable [0] .u.info.chain == gDvm.maxJitTableEntries) ; 
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gDvmJit.pJitEntryTable = pJitTable; 
gDvmJit.jitTableMask - gDvmJit.jitTableSize - 1; 
gDvmJit.jitTableEntriesUsed - 0; 
gDvmJit.pProfTableCopy - gDvmJit.pProfTable - pJitProfTable; 
dvmUnlockMutex (&gDvmJit.tableLock); 

} 


return res; 


} 
(2) 停止 编译 函数 dvmJitStopTranslationRequests0， 如 果 一 个 固定 的 表 或 翻译 缓冲 


满 ， 则 调用 这 个 函数 停止 编译 ， 专 业 可 以 避免 周期 浪费 未 来 的 翻译 要 求 。 主 要 代码 如 下 。 


void dvmJitStopTranslationRequests () 
{ 

/* 

* Note 1: This won't necessarily stop all translation requests, and 

* operates on a delayed mechanism. Running threads look to the copy 

* of this value in their private InterpState structures and won't see 

* this change until it is refreshed (which happens on interpreter 

* entry). 

* Note 2: This is a one-shot memory leak on this table. Because this is a 

* permanent off switch for Jit profiling, it is a one-time leak of 1K 

* bytes, and no further attempt will be made to re-allocate it. Can't 

* free it because some thread may be holding a reference. 

wl 

gDvmJit.pProfTable - gDvmJit.pProfTableCopy - NULL; 


) 
(3) 通过 函数 dvmJitStats0 转 储 调试 和 优化 数据 日 志 ， 主 要 代码 如 下 。 


void dvmJitStats() 
{ 
int i; 
int hit; 
int not_hit; 
int chains; 
if (gDvmJit.pJitEntryTable) { 
for (i=0, chains-hit-not hit-0; 
i « (int) gDvmJit.jitTableSize; 
i++) { 
if (gDvmJit.pJitEntryTable[i].dPC !- 0) 
hit++; 
else 
not_hit++; 
if (gDvmJit.pJitEntryTable[i].u.info.chain !- gDvmJit.jitTableSize) 
chains++; 
} 
LOGD ( 
"JIT: &d traces, %d slots, %d chains, %d maxQ, %d thresh, %s", 
hit, not hit + hit, chains, gDvmJit.compilerMaxQueued, 


gDvmJit.threshold, gDvmJit.blockingMode ? "Blocking" : "Non-blocking"); 


dif defined(EXIT STATS) 
LOGD ( 


JIT 编译 


区 被 填 


«Q 


ie 深入 理解 Android 虚拟 机 


"JIT: Lookups: %d hits, %d misses; %d NoChain, $d normal, %d punt", 
gDvmJit.addrLookupsFound, gDvmJit.addrLookupsNotFound, 
gDvmJit.noChainExit, gDvmJit.normalExit, gDvmJit.puntExit); 
#endif 
LOGD("JIT: $d Translation chains", gDvmJit.translationChains); 
#if defined(INVOKE STATS) 
LOGD("JIT: Invoke: %d chainable, %d pred. chain, $d native, " 
"sd return", 
gDvmJit.invokeChain, gDvmJit.invokePredictedChain, 
gDvmJit.invokeNative, gDvmJit.returnOp) ; 
#endif 
if (gDvmJit.profile) { 
dvmCompilerSortAndPrintTraceProfiles(); 
} 


) 


(4) 通过 函数 dvmJitShutdown(void) 可 以 实现 准时 关机 的 功能 ， 注 意 只 做 一 次 关机 操作 ， 不 
要 试图 重新 启动 。 主 要 代码 如 下 。 


void dvmJitshutdown (void) 


{ 
/* 编 译 线程 关闭 */ 
dvmCompilerShutdown () ; 
dvmCompilerDumpStats () ; 
dvmDestroyMutex (&gDvmJit .tableLock) ; 
if (gDvmJit.pJitEntryTable) { 
free(gDvmJit.pJitEntryTable); 
gDvmJit.pJitEntryTable = NULL; 
) 
if (gDvmJit.pProfTable) { 
free (gDvmJit .pProfTable) ; 
gDvmJit.pProfTable = NULL; 
) 
} 


(5) 核心 函数 dvmJitShutdown(void)， 此 函数 被 define 成 CHECK _JITO， 此 函数 的 功能 是 判 
断 在 什么 条 件 时 认为 需要 编译 。 主 要 代码 如 下 。 

int dvmCheckJit(const u2* pc, Thread* self, InterpState* interpState) 
{ 

int flags,i,len; 

int switchInterp - false; 

int debugOrProfile - (gDvm.debuggerActive || self-»suspendCount 
#if defined(WITH PROFILER) 

|| gDvm.activeProfilers 
#endif 
) 


switch (interpState-»jitState) { 
char* nopStr; 
int target; 
int offset; 
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#endif 


第 12 章 


DecodedInstruction decInsn; 


case 


kJitTSelect: 


dexDecodeInstruction(gDvm.instrFormat, pc, &decInsn); 
#if defined(SHOW TRACE) 
LOGD("TraceGen: adding $s",getOpcodeName (decInsn.opCode) ) ; 


£ 


lags - dexGetInstrFlags (gDvm.instrFlags, decInsn.opCode); 


len - dexGetInstrOrTableWidthAbs (gDvm.instrWidth, pc); 
offset - pc - interpState-»method-»insns; 


i 


} 
i 


i 
i 
i 


f (pc !- interpState-»currRunHead + interpState-»currRunLen) { 
int currTraceRun; 
/* We need to start a new trace run */ 
currTraceRun = ++interpState->currTraceRun; 
interpState-»currRunLen - 0; 
interpState-»currRunHead - (u2*)pc; 
interpState-»trace[currTraceRun].frag.startOffset = offset; 
interpState-»trace[currTraceRun].frag.numInsts = 0; 
interpState-»trace [currTraceRun].frag.runEnd = false; 
interpState-»trace[currTraceRun].frag.hint - kJitHintNone; 
nterpState->trace [interpState->currTraceRun] .frag.numInsts++; 


nterpState->totalTraceLen++; 
nterpState->currRunLen += len; 
f ( ((flags & kInstrUnconditional) == 0) && 
/* don't end trace on INVOKE DIRECT EMPTY */ 
(decInsn.opCode !- OP INVOKE DIRECT EMPTY) && 
((flags & (kInstrCanBranch | 
kInstrCanSwitch | 
kInstrCanReturn | 
kInstrInvoke)) != 0)) { 
interpState->jitState = kJitTSelectEnd; 


#if defined (SHOW_TRACE) 
LOGD("TraceGen: ending on %s, basic block end", 


#endif 


} 
i 


} 
i 


case 


get OpcodeName (decInsn.opCode) ) ; 


f (decInsn.opCode == OP_THROW) { 
interpState->jitState = kJitTSelectEnd; 


f (interpState->totalTraceLen >= JIT_MAX TRACE LEN) { 
interpState->jitState = kJitTSelectEnd; 


f (debugorProfile) { 
interpState-»jitState - kJitTSelectAbort; 
switchInterp = !debugOrProfile; 


break; 
f ((flags & kInstrCanReturn) != kInstrCanReturn) { 
break; 
* NOTE: intentional fallthrough for returns */ 
kJitTSelectEnd: 
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if (interpState->totalTraceLen == 0) { 
switchInterp = !debugOrProfile; 
break; 
} 
JitTraceDescription* desc = 
(JitTraceDescription*) malloc(sizeof (JitTraceDescription) + 
sizeof (JitTraceRun) * (interpState->currTraceRun+1) ); 
if (desc == NULL) { 
LOGE("Out of memory in trace selection") ; 
dvmJitStopTranslationRequests () ; 
interpState->jitState = kJitTSelectAbort; 
switchInterp = !debugOrProfile; 


break; 
} 
interpState-»trace [interpState-»currTraceRun].frag.runEnd = 
true; 


interpState-»jitState - kJitNormal; 

desc-»method - interpState-»method; 

memcpy ( (char*) &(desc->trace[0]), 
(char*)&(interpState-»trace[0]), 
sizeof(JitTraceRun) * (interpState->currTraceRun+1) ) ; 


#if defined (SHOW_TRACE) 


#endif 


LOGD("TraceGen: trace done, adding to queue"); 


dvmCompilerWorkEnqueue ( 
interpState->currTraceHead, kWorkOrderTrace, desc) ; 
if (gDvmJit.blockingMode) { 


dvmCompilerDrainQueue () ; 
} 
switchInterp = !debugOrProfile; 
} 
break; 


case kJitSingleStep: 


interpState->jitState = kJitSingleStepEnd; 
break; 


case kJitSingleStepEnd: 


interpState->entryPoint = kInterpEntryResume; 
switchInterp = !debugOrProfile; 
break; 


case kJitTSelectAbort: 


#if defined (SHOW_TRACE) 


#endif 


LOGD("TraceGen: trace abort"); 


interpState->jitState = kJitNormal; 
switchInterp = !debugOrProfile; 
break; 


case kJitNormal: 


switchInterp = !debugOrProfile; 
break; 


default: 


dvmAbort () ; 
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} 


return switchInterp; 


} 

在 上 述 函 数 中 ,增加 了 目前 跟踪 请 求 的 一 个 指令 的 时 间 ， 这 只 是 在 指令 中 实现 的 解释 工作 。 
一 般 来 说 ， 指 示 “ 建 议 ”被 添加 到 对 当前 跟踪 之 前 解释 。 如 果 解 释 器 成 功 地 完成 指令 动作 ， 则 
将 被 视 为 请 求 的 一 部 分 ， 这 使 我 们 能 够 审查 在 这 之 前 的 状态 。 如 果 中 止 查询 指令 ， 则 会 发 生意 
想不到 的 事情 ， 然 而 返回 指令 将 会 导致 立即 结束 翻译 工作 ， 这 一 切 都 是 在 编译 器 回归 前 完成 的 。 
这 样 做 的 目的 是 针对 特殊 处 理 返回 一 定 的 解释 ， 并 对 问题 根源 进行 了 描述 。 

(6) 通过 dvmJitGetCodeAddr(const u2* dPC)， 如 果 在 虚拟 机 指针 中 存在 翻译 的 代码 地 址 ， 
则 加 速 翻译 这 个 进程 。 主 要 代码 如 下 。 

void* dvmJitGetCodeAddr(const u2* dPC) 


{ 


int idx = dvmJitHash(dPC) ; 


/* If anything is suspended, don't re-enter the code cache */ 
if (gDvm.sumThreadSuspendCount > 0) { 

return NULL; 
} 


/* Expect a high hit rate on 1st shot */ 
if (gDvmdit .pditEntryTable [idx] .dPC == dPC) { 
#if defined(EXIT STATS) 
gDvmJit .addrLookupsFound++; 
#endif 
return gDvmJit .pJitEntryTable [idx] .codeAddress; 
} else { 
int chainEndMarker = gDvmJit.jitTableSize; 
while (gDvmJit.pJitEntryTable[idx].u.info.chain !- chainEndMarker) { 
idx - gDvmJit.pJitEntryTable [idx].u.info.chain; 
if (gDvmJit.pJitEntryTable[idx].dPC -- dPC) { 
#if defined(EXIT STATS) 
gDvmJit .addrLookupsFound++; 
#endif 
return gDvmJit .pJitEntryTable [idx] .codeAddress; 


} 


#if defined (EXIT STATS) 
gDvmJit.addrLookupsNotFound--; 
#endif 
return NULL; 


} 


(7) 通过 dvmJitLookupAndAdd(const u2* dPC) 判断 是 否 有 相对 某 段 程序 的 字 节 码 可 用 , 如 
果 有 ， 则 返回 其 地 址 ， 如果 没有 ， 则 做 标记 ， 以 通知 编译 线程 对 其 进行 编译 。 主 要 代码 如 下 。 


JitEntry *dvmJitLookupAndAdd (const u2* dPC) 


u4 chainEndMarker = gDvmJit.jitTableSize; 
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u4 idx = dvmJitHash(dPC); 


/* Walk the bucket chain to find an exact match for our PC */ 
while ((gDvmJit.pJitEntryTable[idx].u.info.chain !- chainEndMarker) && 
(gDvmJit.pJitEntryTable[idx].dPC !- dPC)) { 
idx = gDvmJit.pJitEntryTable [idx] .u.info.chain; 


if (gDvmJit.pJitEntryTable[idx].dPC != dPC) { 
/* 
* No match. Aquire jitTableLock and find the last 
* slot in the chain. Possibly continue the chain walk in case 
* some other thread allocated the slot we were looking 
* at previuosly (perhaps even the dPC we're trying to enter). 
f 
dvmLockMutex (&gDvmJit.tableLock); 
/* 
* At this point, if .dPC is NULL, then the slot we're 
* looking at is the target slot from the primary hash 
* (the simple, and common case). Otherwise we're going 
* to have to find a free slot and chain it. 
ay, 
MEM BARRIER(); /* Make sure we reload [].dPC after lock */ 
if (gDvmJit.pJitEntryTable[idx].dPC !- NULL) { 
u4 prev; 
while (gDvmJit.pJitEntryTable[idx].u.info.chain !- chainEndMarker) ( 
if (gDvmJit.pJitEntryTable[idx].dPC -- dPC) { 
/* Another thread got there first for this dPC */ 
dvmUnlockMutex (&gDvmJit .tableLock) ; 
return &gDvmJit .pJitEntryTable [idx] ; 
} 
idx = gDvmJit.pJitEntryTable [idx] .u.info.chain; 
} 
/* Here, idx should be pointing to the last cell of an 
* active chain whose last member contains a valid dPC */ 
assert (gDvmJit .pJitEntryTable [idx] .dPC !- NULL); 
/* Linear walk to find a free cell and add it to the end */ 
prev = idx; 
while (true) { 
idx++; 
if (idx chainEndMarker) 
idx ; /* Wraparound */ 
if ((gDvmJit .pJitEntryTable [idx] .dPC == NULL) || 
(idx == prev)) 
break; 


} 
if (idx != prev) { 
JitEntryInfoUnion oldValue; 
JitEntryInfoUnion newValue; 
/* 
* Although we hold the lock so that noone else will 
* be trying to update a chain field, the other fields 
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* packed into the word may be in use by other threads. 
n 
do ( 

oldValue - gDvmJit.pJitEntryTable [prev] .u; 

newValue - oldValue; 

newValue.info.chain - idx; 

} while (!ATOMIC CMP SWAP( 
&gDvmJit.pJitEntryTable [prev] .u. infoWord, 
oldValue.infoWord, newValue.infoWord)); 

} 
} 
if (gDvmJit.pJitEntryTable[idx].dPC == NULL) { 
/* Allocate the slot */ 
gDvmJit .pJitEntryTable [idx] .daPC = dPC; 
gDvmJit .jitTableEntriesUsed++; 
} else { 
/* Table is full */ 
idx = chainEndMarker; 
} 
dvmUnlockMutex (&gDvmJit.tableLock); 
) 
return (idx == chainEndMarker) ? NULL : &gDvmJit.pJitEntryTable [idx] ; 


} 


(8) 通过 dvmJitSetCodeAddr(const u2* dPC, void *nPC, JitInstructionSetType seb 将 代码 指针 
注册 为 IT 码 。 如 果 被 编译 的 代码 地 址 为 室 ， 则 不 能 停止 所 有 的 线程 工作 ， 这 样 的 程序 被 称 为 
编译 线程 。 主 要 代码 如 下 。 


void dvmJitSetCodeAddr(const u2* dPC, void *nPC, JitInstructionSetType set) { 

JitEntryInfoUnion oldValue; 

JitEntryInfoUnion newValue; 

JitEntry *jitEntry = dvmJitLookupAndAdd (dPC) ; 

assert (jitEntry) ; 

/* Note: order of update is important */ 

do { 

oldValue = jitEntry->u; 
newValue = oldValue; 
newValue.info.instructionSet = set; 

} while (!ATOMIC CMP SWAP( 
&jitEntry-»u.infoWord, 
oldValue.infoWord, newValue.infoWord)); 

jitEntry-»codeAddress - nPC; 


} 

(9) 通过 dvmJitCheckTraceRequest(Thread* self, InterpState* interpState) 确 定 是 否 存在 有 效 
的 “trace-bulding” 活 跃 ， 如 果 需 要 中 止 和 切换 到 快速 翻译 ， 则 返回 真 ， 否 则 返回 假 。 主 要 代码 
如 下 。 


bool dvmJitCheckTraceRequest (Thread* self, InterpState* interpState) 


{ 


bool res = false; /* Assume success */ 
int i; 


«Q 
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if (gDvmJit.pJitEntryTable != NULL) { 
/* Two-level filtering scheme */ 
for (i-0; i« JIT TRACE THRESH FILTER SIZE; i++) { 
if (interpState-»pc == interpState-»threshFilter[i]) { 


break; 
} 
} 
if (i == JIT TRACE THRESH FILTER SIZE) { 
/* 
* Use random replacement policy - otherwise we could miss a large 
* loop that contains more traces than the size of our filter array. 
xi 
i = rand() % JIT TRACE THRESH FILTER SIZE; 
interpState-»threshFilter[i] - interpState-»pc; 
res - true; 
} 
/* 


* If the compiler is backlogged, or if a debugger or profiler is 
* active, cancel any JIT actions 
Wi 
if ( res || (gDvmJit.compilerQueueLength »- gDvmJit.compilerHighWater) || 
gDvm.debuggerActive || self-»suspendCount 
#if defined(WITH PROFILER) 
|| gDvm.activeProfilers 
#endif 
nd 
if (interpState->jitState !- kJitOff) { 
interpState-»jitState - kJitNormal; 
} 


} else if (interpState->jitState == kJitTSelectRequest) { 
JitEntry *slot = dvmJitLookupAndAdd (interpState-»pc); 
if (slot -- NULL) ( 

/* 
* Table is full. This should have been 
* detected by the compiler thread and the table 
* resized before we run into it here. Assume bad things 
* are afoot and disable profiling. 
oY 
interpState->jitState = kJitTSelectAbort; 
LOGD("JIT: JitTable full, disabling profiling"); 
dvmJitStopTranslationRequests(); 
} else if (slot-»u.info.traceRequested) { 
/* Trace already requested - revert to interpreter */ 
interpState->jitState = kJitTSelectAbort; 
} else { 
/* Mark request */ 
JitEntryInfoUnion oldValue; 
JitEntryInfoUnion newValue; 
do { 
oldValue slot->u; 
newValue = oldValue; 
newValue.info.traceRequested = true; 


则 返 


} 


e 
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) while (!ATOMIC CMP SWAP( &slot-»u.infoWord, 
oldValue.infoWord, newValue.infoWord)); 
} 
} 
switch (interpState->jitState) { 
case kJitTSelectRequest: 
interpState-»jitState - kJitTSelect; 
interpState-»currTraceHead - interpState-»pc; 
interpState-»currTraceRun ; 
interpState-»totalTraceLen - 0; 
interpState-»currRunHead - interpState-»pc; 
interpState-»currRunLen - 0; 
interpState->trace[0] .frag.startOffset = 
interpState-»pc - interpState->method->insns; 
interpState->trace [0] .frag.numInsts = 0; 
interpState->trace[0] .frag.runEnd = false; 
interpState-»trace[0].frag.hint = kJitHintNone; 
break; 
case kJitTSelect: 
case kJitTSelectAbort: 
res - true; 
case kJitSingleStep: 
case kJitSingleStepEnd: 
case kJitOff: 
case kJitNormal: 


break; 
default: 
dvmAbort () ; 
} 
) 
return res; 
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(10) 通过 dvmJitResizeJitTable( unsigned int size ) 调 整 JIT 码 , 此 处 必须 是 2 HR. WR AM, 


El 


真 ， 并 停止 所 有 的 线程 。 主 要 代码 如 下 。 


bool dvmJitResizeJitTable( unsigned int size ) 


{ 


JitEntry *pNewTable; 
JitEntry *pOldTable; 
u4 newMask; 

unsigned int oldSize; 
unsigned int i; 


assert(gDvm.pJitEntryTable !- NULL); 
assert (size && !(size & (size - 1)));  /* Is power of 2? */ 


LOGD("Jit: resizing JitTable from %d to $d", gDvmJit.jitTableSize, size); 


newMask - size - 1; 


if (size «- gDvmJit.jitTableSize) { 
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return true; 


pNewTable = (JitEntry*)calloc(size, sizeof (*pNewTable)); 
if (pNewTable -- NULL) { 
return true; 
} 
for (i-0; i< size; i++) { 
pNewTable [i] .u.info.chain = size; /* Initialize chain termination */ 


} 


/* Stop all other interpreting/jit'ng threads */ 
dvmSuspendAllThreads (SUSPEND FOR JIT); 


pOldTable = gDvmJit.pJitEntryTable; 
oldSize = gDvmJit.jitTableSize; 


dvmLockMutex (&gDvmJit .tableLock) ; 
gDvmJit.pJitEntryTable = pNewTable; 
gDvmJit.jitTableSize = size; 
gDvmJit.jitTableMask = size - 1; 
gDvmJit.jitTableEntriesUsed - 0; 
dvmUnlockMutex (&gDvmJit.tableLock); 


for (i-0; i < oldSize; i++) { 
if (poldTable[i].dPC) { 
JitEntry *p; 
u2 chain; 
p = dvmJitLookupAndAdd (poldTable [i] .dPC) ; 
p-»dPC = pOldTable[i].dPC; 
/* 
* Compiler thread may have just updated the new entry's 
* code address field, so don't blindly copy null. 
Ai 
if (pOldTable[i] .codeAddress != NULL) { 
p->codeAddress = pOldTable[i].codeAddress; 
} 


/* We need to preserve the new chain field, but copy the rest */ 
dvmLockMut ex (&gDvmJit .tableLock) ; 

chain = p->u.info.chain; 

p->u = pOldTable [i] .u; 

p->u.info.chain = chain; 

dvmUnlockMutex (&gDvmJit .tableLock) ; 


} 
free (pOldTable) ; 


/* Restart the world */ 
dvmResumeAllThreads (SUSPEND FOR JIT); 


return false; 


} 
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(11) 通过 dvmJitd21(double d) 和 dvmJitf21(float 了 进行 格式 转换 ， 分 别 将 double 格式 和 float 
格式 设置 为 最 大 和 最 小 的 整数 格式 。 主 要 代码 如 下 。 


s8 dvmJitd21(double d) 


{ 


) 


static const double kMaxLong = (double) (s8)Ox7fffffffffffffffULL; 
static const double kMinLong (double) (s8)0x8000000000000000ULL; 
if (d »- kMaxLong) 

return (s8)Ox7fffffffffffffffULL; 
else if (d «- kMinLong) 

return (s8)0x8000000000000000ULL; 
else if (d !- d) // NaN case 

return 0; 
else 

return (s8)d; 


s8 dvmJitf2l(float f) 


{ 


static const float kMaxLong (float) (s8) OXx7£ ffffffffffffffULL; 
static const float kMinLong - (float) (s8)0x8000000000000000ULL; 
if (f »- kMaxLong) 

return (s8)Ox7fffffffffffffffULL; 
else if (f «- kMinLong) 

return (s8)0x8000000000000000ULL; 
else if (f !- f) // NaN case 

return 0; 
else 

return (s8)f; 


12.4.2 ”核心 函数 


在 文件 vn/compiler/compiler.c 中 定义 了 核心 函数 的 具体 实现 ， 下 面 分 析 这 个 文件 的 源码 。 
(1) 在 虚拟 机 启动 时 会 调用 函数 dvmCompilerStartup(void)。 主 要 代码 如 下 。 
bool dvmCompilerStartup (void) 


{ 


/* Make sure the BBType enum is in sane state */ 
assert(CHAINING CELL NORMAL -- 0); 


/* Architecture-specific chores to initialize */ 
if (!dvmCompilerArchInit ()) 
goto fail; 


* 


Setup the code cache if it is not done so already. For apps it should be 
done by the Zygote already, but for command-line dalvikvm invocation we 
need to do it here. 


* + 
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if (gDvmJit.codeCache -- NULL) { 
if (!dvmCompilerSetupCodeCache()) 


goto fail; 
} 
/* Allocate the initial arena block */ 
if (dvmCompilerHeapInit() == false) { 
goto fail; 
} 


dvmInitMutex (&gDvmJit . compilerLock) ; 
pthread cond init(&gDvmJit.compilerQueueActivity, NULL); 
pthread cond init(&gDvmJit.compilerQueueEmpty, NULL); 


dvmLockMutex (&gDvmJit.compilerLock); 
gDvmJit.haltCompilerThread - false; 


/* Reset the work queue */ 
memset (gDvmJit.compilerWorkQueue, 0, 
sizeof (CompilerWorkOrder) * COMPILER WORK QUEUE SIZE); 
gDvmJit.compilerWorkEnqueueIndex - gDvmJit.compilerWorkDequeueIndex - 
gDvmJit.compilerQueueLength - 0; 
gDvmJit.compilerHighWater - 
COMPILER WORK QUEUE SIZE - (COMPILER WORK QUEUE SIZE/4); 


assert(gDvmJit.compilerHighWater « COMPILER WORK QUEUE SIZE); 
if (!dvmCreateInternalThread(&gDvmJit.compilerHandle, "Compiler", 
compilerThreadStart, NULL)) { 
dvmUnlockMutex (&gDvmdit .compilerLock) ; 
goto fail; 
} 
/* Track method-level compilation statistics */ 
gDvmJit.methodStatsTable = dvmHashTableCreate (32, NULL); 
dvmUnlockMutex (&gDvmJit .compilerLock) ; 
return true; 
fail: 
return false; 
} 


(2) 在 虚拟 机 关闭 时 会 调用 函数 dvmCompilerShutdown(void)。 主 要 代码 如 下 。 
void dvmCompilerShutdown (void) 


{ 

void *threadReturn; 

if (gDvmJit.compilerHandle) { 
gDvmJit.haltCompilerThread - true; 
dvmLockMutex (&gDvmJit.compilerLock); 
pthread cond signal (&gDvmJit .compilerQueueActivity) ; 
dvmUnlockMutex (&gDvmJit .compilerLock) ; 
if (pthread join(gDvmJit.compilerHandle, &threadReturn) !- 0) 

LOGW("Compiler thread join failed\n") ; 

else 


0; 
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LOGD("Compiler thread has shut down\n"); 


} 


(3) compilerThreadStart(void *arg) 是 线程 函数 ， 被 dvmCompilerStartup0 调 用 ， 是 在 虚拟 机 
运行 过 程 中 一 直 生 存 的 线程 ，while 循环 判断 是 否 有 代码 需要 编译 ， 如 果 有 ， 则 调用 
dvmCompilerDoWorkO 对 其 进行 编译 。 主 要 代码 如 下 。 


Static void *compilerThreadStart(void *arg) 
{ 
dvmLockMutex (&gDvmJit .compilerLock) ; 
/* 
* Since the compiler thread will not touch any objects on the heap once 
* being created, we just fake its state as VMWAIT so that it can be a 
* bit late when there is suspend request pending. 
x 
dvmChangeStatus (NULL, THREAD VMWAIT); 
while (!gDvmJit.haltCompilerThread) ( 


if (workQueueLength() == 0) { 
int cc; 
cc = pthread cond signal (&gDvmJit .compilerQueueEmpty) ; 
assert(cc -- 0); 


pthread cond wait (&gDvmJit .compilerQueueActivity, 
&gDvmJit.compilerLock); 
continue; 
} eise ( 
do { 
CompilerWorkOrder work = workDequeue() ; 
dvmUnlockMutex (&gDvmdit .compilerLock) ; 
/* Check whether there is a suspend request on me */ 
dvmCheckSuspendPending (NULL) ; 
/* Is JitTable filling up? */ 
if (gDvmJit.jitTableEntriesUsed » 
(gDvmJit.jitTableSize - gDvmJit.jitTableSize/4)) { 
dvmJitResizeJitTable(gDvmJit.jitTableSize * 2); 
} 
if (gDvmJit.haltCompilerThread) { 
LOGD("Compiler shutdown in progress - discarding request"); 
) else { 
/* Compilation is successful */ 
if (dvmCompilerDoWork(&work)) { 
dvmJitSetCodeAddr(work.pc, work.result.codeAddress, 
work.result.instructionSet); 


} 
} 


free (work. info) ; 
dvmLockMutex (&gDvmJit .compilerLock) ; 
} while (workQueueLength() != 0); 
} 
} 
pthread_cond_signal (&gDvmJit .compilerQueueEmpty) ; 
dvmUnlockMutex (&gDvmJit .compilerLock) ; 
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LOGD("Compiler thread shutting down\n") ; 
return NULL; 


} 
(4) 函数 dvmCompilerSetupCodeCache(void) 的 功能 是 存储 编译 后 的 字 节 码 。 具 体 代 码 如 下 。 


bool dvmCompilerSetupCodeCache (void) 


i 
extern void dvmCompilerTemplateStart (void) ; 
extern void dmvCompilerTemplateEnd (void) ; 
/* Allocate the code cache */ 
gDvmJit.codeCache = mmap(0, CODE CACHE SIZE, 
PROT READ | PROT WRITE | PROT EXEC, 
MAP PRIVATE | MAP ANONYMOUS, -1, 0); 
if (gDvmJit.codeCache -- MAP FAILED) ( 
LOGE("Failed to create the code cache: %s\n", strerror(errno)); 
return false; 
} 
/* Copy the template code into the beginning of the code cache */ 
int templateSize = (intptr_t) dmvCompilerTemplateEnd - 
(intptr_t) dvmCompilerTemplateStart; 
memcpy ( (void *) gDvmJit.codeCache, 
(void *) dvmCompilerTemplateStart, 
templateSize); 
gDvmJit.templateSize - templateSize; 
gDvmJit.codeCacheByteUsed - templateSize; 
/* Flush dcache and invalidate the icache to maintain coherence */ 
cacheflush((intptr t) gDvmJit.codeCache, 
(intptr t) gDvmJit.codeCache « CODE CACHE SIZE, 0); 
return true; 
} 


对 上 述 函数 有 如 下 4 点 说 明 。 

gDvnJit.codeCache: 使 用 mmap 分 配 (1024x1024)， 用 于 存在 编译 后 的 代码 。 
gDvnJit.codeCacheByteUsed: codeCache 的 使 用 情况 。 
gDvmJit.codeCacheFull: codeCache 是 否 已 写 满 。 

gDvmJitpJitEntryTable: entry 表 ， 每 个 trace 对 应 一 个 entry。 


124.3 ”编译 文件 


在 文件 vm/compiler/Frongend.c 中 定义 了 两 个 方法 ， 分 别 实现 了 两 种 编译 方法 。 
(1). 通过 函数 dvmCompileMethod0 实 现 method 方法 , 即 以 函数 或 方法 为 单位 进行 编译 。 实 
现代 码 如 下 。 


bool dvmCompileMethod(const Method *method, JitTranslationInfo *info) 


{ 


oooo 


> 
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const DexCode *dexCode = dvmGetMethodCode (method) ; 
const u2 *codePtr - dexCode-»insns; 

const u2 *codeEnd - dexCode-»insns « dexCode-»insnsSize; 
int blockID - 0; 

unsigned int curOffset - 0; 


BasicBlock *firstBlock = dvmCompilerNewBB (DALVIK_BYTECODE) ; 
firstBlock->id = blockID++; 


/* Allocate the bit-vector to track the beginning of basic blocks */ 
BitVector *bbStartAddr = dvmAllocBitVector (dexCode->insnsSize+1, false) ; 
dvmSetBit (bbStartAddr, 0); 


/* 


* Sequentially go through every instruction first and put them in a single 


* basic block. Identify block boundaries at the mean time. 
af 
while (codePtr < codeEnd) { 
MIR *insn = dvmCompilerNew(sizeof (MIR), false) ; 
insn->offset = curOffset; 
int width = parseInsn(codePtr, &insn->dalvikInsn, false) ; 
bool isInvoke = false; 
const Method *callee; 
insn->width = width; 


/* Terminate when the data section is seen */ 
if (width == 0) 
break; 
dvmCompilerAppendMIR(firstBlock, insn) ; 
/* 
* Check whether this is a block ending instruction and whether it 
* suggests the start of a new block 
xj; 
unsigned int target = curOffset; 


/* 
* If findBlockBoundary returns true, it means the current instruction 
* is terminating the current block. If it is a branch, the target 
* address will be recorded in target. 
S 
if (findBlockBoundary (method, insn, curOffset, &target, &isInvoke, 
&callee)) { 
dvmSetBit(bbStartAddr, curOffset + width); 
if (target !- curOffset) [ 
dvmSetBit(bbStartAddr, target); 
} 


} 


codePtr += width; 
/* each bit represents 16-bit quantity */ 
curOffset += width; 
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/* 
* The number of blocks will be equal to the number of bits set to 1 in the 
* bit vector minus 1, because the bit representing the location after the 
* last instruction is set to one. 
E 
int numBlocks = dvmCountSetBits (bbStartAddr); 
if (dvmIsBitSet (bbStartAddr, dexCode->insnsSize) ) 1 
numBlocks--; 
} 


CompilationUnit cUnit; 
BasicBlock **blockList; 


memset (&cUnit, 0, sizeof (CompilationUnit) ) ; 

cUnit.method = method; 

blockList = cUnit.blockList = 
dvmCompilerNew (sizeof (BasicBlock *) * numBlocks, true); 


/* 

* Register the first block onto the list and start split it into block 
* boundaries from there. 

s 

blockList[0] - firstBlock; 

cUnit.numBlocks - 1; 


int i; 

for (i = 0; i < numBlocks; i++) { 
MIR *insn; 
BasicBlock *curBB - blockList [i]; 
curOffset - curBB-»lastMIRInsn-»offset; 


for (insn = curBB->firstMIRInsn->next; insn; insn = insn-»next) ( 
/* Found the beginning of a new block, see if it is created yet */ 
if (dvmIsBitSet(bbStartAddr, insn-»offset)) { 
int j; 
for (j = 0; j < cUnit.numBlocks; j++) { 
if (blockList [j]->firstMIRInsn->offset == insn->offset) 
break; 


/* Block not split yet - do it now */ 
if (j == cUnit.numBlocks) { 
BasicBlock *newBB = dvmCompilerNewBB (DALVIK_BYTECODE) ; 
newBB->id = blockID++; 
newBB->firstMIRInsn = insn; 
newBB->startOffset = insn->offset; 
newBB->lastMIRInsn = curBB->lastMIRInsn; 
curBB->lastMIRInsn = insn->prev; 
insn->prev->next = NULL; 
insn->prev = NULL; 
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/* 

* If the insn is not an unconditional branch, set up the 

* fallthrough link. 

x 

if (!isUnconditionalBranch (curBB->lastMIRInsn) ) { 
curBB->fallThrough = newBB; 


} 


/* enqueue the new block */ 
blockList [cUnit .numBlocks++] = newBB; 
break; 


} 


if (numBlocks != cUnit.numBlocks) { 
LOGE("Expect &d vs %d basic blocks\n", numBlocks, cUnit.numBlocks) ; 
dvmAbort () ; 


} 


dvmFreeBitVector (bbStartAddr) ; 


/* Connect the basic blocks through the taken links */ 
for (i = 0; i < numBlocks; i++) { 

BasicBlock *curBB = blockList [i]; 

MIR *insn = curBB->lastMIRInsn; 

unsigned int target = insn->offset; 

bool isInvoke; 

const Method *callee; 


findBlockBoundary (method, insn, target, &target, &isInvoke, &callee) ; 


/* Found a block ended on a branch */ 
if (target != insn->offset) { 
int 4; 
/* Forward branch */ 
if (target > insn->offset) { 
j=i+1; 
} else { 
/* Backward branch */ 
j= 0; 
} 
for (; j < numBlocks; j++) { 
if (blockList [j] ->firstMIRInsn->offset == target) { 
curBB->taken = blockList[j]; 
break; 


} 


/* Don't create dummy block for the callee yet */ 
if (j == numBlocks && !isInvoke) { 
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LOGE("Target not found for insn $x: expect target %x\n", 
curBB-»lastMIRInsn-»offset, target); 
dvmAbort () ; 


} 
} 


/* Set the instruction set to use (NOTE: later components may change it) */ 
cUnit.instructionSet = dvmCompilerInstructionSet (&cUnit) ; 
dvmCompilerMIR2LIR (&cUnit) ; 

dvmCompilerAssembleLIR(&cUnit, info) ; 

dvmCompilerDumpCompilationUnit (&cUnit) ; 

dvmCompilerArenaReset () ; 

return info->codeAddress != NULL; 


} 
(2) 通过 函数 dvmCompileMethod( SEM trace 方法 ， 即 以 trace 为 单位 进行 编译 (可 以 把 循环 


的 内 容 作为 单位 编译 )， 此 方法 也 包含 method 方法 。 实 现代 码 如 下 。 


bool dvmCompileTrace(JitTraceDescription *desc, int numMaxInsts, 
JitTranslationInfo *info) 
{ 


const DexCode *dexCode = dvmGetMethodCode (desc->method) ; 
const JitTraceRun* currRun - &desc-»trace [0]; 
unsigned int curOffset - currRun-»frag.startOffset; 
unsigned int numInsts - currRun-»frag.numInsts; 
const u2 *codePtr - dexCode-»insns « curOffset; 
int traceSize = 0; // # of half-words 

const u2 *startCodePtr - codePtr; 

BasicBlock *startBB, *curBB, *lastBB; 

int numBlocks - 0; 

static int compilationId; 

CompilationUnit cUnit; 

CompilerMethodStats *methodStats; 


compilationId++; 
memset (&cUnit, 0, sizeof (CompilationUnit) ) ; 


/* Locate the entry to store compilation statistics for this method */ 
methodStats = analyzeMethodBody (desc->method) ; 


cUnit .registerScoreboard.nullCheckedRegs = 
dvmAllocBitVector (desc->method->registersSize, false) ; 


/* Initialize the printMe flag */ 
cUnit.printMe = gDvmJit.printMe; 


/* Initialize the profile flag */ 
cUnit.executionCount - gDvmJit.profile; 


/* Identify traces that we don't want to compile */ 
if (gDvmJit.methodTable) { 
int len = strlen(desc-»method-»clazz-»descriptor) + 
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strlen(desc-»method-»name) + 1; 
char *fullSignature - dvmCompilerNew(len, true); 
strcpy(fullSignature, desc-»method-»clazz-»descriptor); 
strcat(fullSignature, desc->method->name) ; 
int hashValue = dvmComputeUtf8Hash (fullSignature) ; 
/* 
* Doing three levels of screening to see whether we want to skip 
* compiling this method 
UL 
/* First, check the full "class;method" signature */ 
bool methodFound = 
dvmHashTableLookup (gDvmJit.methodTable, hashValue, 
fullSignature, (HashCompareFunc) strcmp, 
false) !- 
NULL; 


/* Full signature not found - check the enclosing class */ 
if (methodFound -- false) ( 
int hashValue = dvmComputeUtf8Hash (desc-»method-»clazz-»descriptor); 
methodFound - 
dvmHashTableLookup (gDvmJit.methodTable, hashValue, 
(char *) desc-»method-»clazz-»descriptor, 
(HashCompareFunc) strcmp, false) !- 
NULL; 
/* Enclosing class not found - check the method name */ 
if (methodFound == false) { 
int hashValue = dvmComputeUtf8Hash (desc->method->name) ; 
methodFound - 
dvmHashTableLookup (gDvmJit.methodTable, hashValue, 
(char *) desc-»method-»name, 
(HashCompareFunc) strcmp, false) !- 
NULL; 


* Under the following conditions, the trace will be *conservatively* 

* compiled by only containing single-step instructions to and from the 
* interpreter. 

* 1) If includeSelectedMethod -- false, the method matches the full or 
* partial signature stored in the hash table. 

* 

* 

* 


2) If includeSelectedMethod -- true, the method does not match the 
full and partial signature stored in the hash table. 


if (gDvmJit.includeSelectedMethod !- methodFound) { 
cUnit.allSingleStep - true; 
) eise ( 
/* Compile the trace as normal */ 
/* Print the method we cherry picked */ 
if (gDvmJit.includeSelectedMethod -- true) { 
cUnit.printMe = true; 


«Q 


LECT. Android 虚拟 机 


/* Allocate the first basic block */ 
lastBB = startBB = curBB = dvmCompilerNewBB (DALVIK BYTECODE); 
curBB-»startOffset = curOffset; 
curBB->id = numBlocks++; 
if (cUnit.printMe) { 
LOGD ("-------- \nCompiler: Building trace for %s, offset 0x%x\n", 
desc->method->name, curOffset) ; 


* Analyze the trace descriptor and include up to the maximal number 
* of Dalvik instructions into the IR. 
Sk 
while (1) { 
MIR *insn; 
int width; 
insn = dvmCompilerNew (sizeof (MIR) , false) ; 
insn-»offset = curOffset; 
width - parseInsn(codePtr, &insn-»dalvikInsn, cUnit.printMe); 
/* The trace should never incude instruction data */ 
ert (width); 
insn-»width - width; 
traceSize «- width; 
dvmCompilerAppendMIR(curBB, insn); 
cUnit .numInsts++; 
/* Instruction limit reached - terminate the trace here */ 
if (cUnit.numInsts >= numMaxInsts) { 
break; 
} 


if (--numInsts == 0) { 

if (currRun->frag.runEnd) { 
break; 

} else { 
curBB = dvmCompilerNewBB (DALVIK_BYTECODE) ; 
lastBB->next = curBB; 
lastBB = curBB; 
curBB->id = numBlocks++; 
currRun++; 
curOffset = currRun->frag.startOffset; 
numInsts = currRun-»frag.numInsts; 
curBB-»startOffset - curOffset; 
codePtr - dexCode-»insns « curOffset; 


} 

} else { 
curOffset += width; 
codePtr += width; 


} 


/* Convert # of half-word to bytes */ 


Q^ 
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methodStats-»compiledDalvikSize += traceSize * 2; 
/* 
* Now scan basic blocks containing real code to connect the 
* taken/fallthrough links. Also create chaining cells for code not included 
* in the trace. 
x 
for (curBB - startBB; curBB; curBB - curBB-»next) ( 

MIR *lastInsn - curBB-»lastMIRInsn; 

/* Hit a pseudo block - exit the search now */ 

if (lastInsn -- NULL) { 

break; 
} 


curOffset = lastInsn->offset; 
unsigned int targetOffset = curOffset; 
unsigned int fallThroughOffset - curOffset « lastInsn-»width; 
bool isInvoke - false; 
const Method *callee - NULL; 
findBlockBoundary (desc-»method, curBB->lastMIRInsn, curOffset, 
&targetOffset, &isInvoke, &callee); 
/* Link the taken and fallthrough blocks */ 
BasicBlock *searchBB; 
/* No backward branch in the trace - start searching the next BB */ 
for (searchBB - curBB-»next; searchBB; searchBB - searchBB-»next) { 
if (targetOffset == searchBB->startOffset) { 
curBB->taken = searchBB; 
} 


if (fallThroughOffset == searchBB->startOffset) { 
curBB->fallThrough = searchBB; 
} 
} 


int flags = dexGetInstrFlags (gDvm.instrFlags, 
lastInsn-»dalvikInsn.opCode); 


* Some blocks are ended by non-control-flow-change instructions, 

* currently only due to trace length constraint. In this case we need 
* to generate an explicit branch at the end of the block to jump to 

* the chaining cell. 

* 

* 


NOTE: INVOKE DIRECT EMPTY is actually not an invoke but a nop 
HB 
curBB-»needFallThroughBranch - 
((flags & (kInstrCanBranch | kInstrCanSwitch | kInstrCanReturn | 
kInstrInvoke)) -- 0) || 
(lastInsn->dalvikInsn.opCode == OP INVOKE DIRECT EMPTY); 
/* Target block not included in the trace */ 
if (curBB-»taken -- NULL && 
(isInvoke || (targetOffset !- curOffset))) { 
BasicBlock *newBB; 
if (isInvoke) { 
/* Monomorphic callee */ 
if (callee) { 
newBB = dvmCompilerNewBB(CHAINING CELL INVOKE SINGLETON); 
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newBB-»startOffset = 0; 
newBB-»containingMethod - callee; 
/* Will resolve at runtime */ 
) eise ( 


newBB = dvmCompilerNewBB(CHAINING CELL INVOKE PREDICTED); 


newBB-»startOffset - 0; 


} 


/* For unconditional branches, request a hot chaining cell */ 


} else { 
newBB = dvmCompilerNewBB(flags & kInstrUnconditional ? 
CHAINING CELL HOT : 
CHAINING CELL NORMAL); 
newBB-»startOffset - targetOffset; 
} 
newBB->id = numBlocks++; 
curBB->taken = newBB; 
lastBB->next = newBB; 
lastBB = newBB; 


} 


/* Fallthrough block not included in the trace */ 


if (!isUnconditionalBranch(lastInsn) && curBB->fallThrough == NULL) { 


/* 
* If the chaining cell is after an invoke or 


* instruction that cannot change the control flow, request a hot 


* chaining cell. 
ay 
if (isInvoke || curBB-»needFallThroughBranch) { 
lastBB->next = dvmCompilerNewBB (CHAINING CELL HOT); 
} else { 
lastBB->next = dvmCompilerNewBB(CHAINING CELL NORMAL); 
} 


lastBB = lastBB->next; 

lastBB->id = numBlocks++; 
lastBB->startOffset = fallThroughOffset; 
curBB->fallThrough = lastBB; 


} 

/* Now create a special block to host PC reconstruction code */ 
lastBB->next = dvmCompilerNewBB(PC_RECONSTRUCTION) ; 

lastBB = lastBB->next; 

lastBB->id = numBlocks++; 


/* And one final block that publishes the PC and raise the exception */ 


lastBB->next = dvmCompilerNewBB (EXCEPTION HANDLING); 
lastBB = lastBB->next; 
lastBB->id = numBlocks++; 


if (cUnit.printMe) { 
LOGD("TRACEINFO ($d): 0x%08x %s%s Ox%x %d of td, td blocks", 
compilationId, 
(intptr_t) desc->method->insns, 
desc->method->clazz->descriptor, 
desc->method->name, 
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desc-»trace[0].frag.startOffset, 
traceSize, 
dexCode-»insnsSize, 
numBlocks); 
} 
BasicBlock **blockList; 
cUnit.method = desc->method; 
cUnit.traceDesc = desc; 
cUnit .numBlocks = numBlocks; 
dvmInitGrowableList (&cUnit.pcReconstructionList, 8); 
blockList = cUnit.blockList = 
dvmCompilerNew (sizeof (BasicBlock *) * numBlocks, true); 
int i; 
for (i = 0, curBB = startBB; i < numBlocks; i++) { 
blockList [i] = curBB; 
curBB = curBB->next; 
} 
/* Make sure all blocks are added to the cUnit */ 
assert (curBB == NULL); 
if (cUnit.printMe) { 
dvmCompilerDumpCompilationUnit (&cUnit) ; 
} 


/* Set the instruction set to use (NOTE: later components may change it) */ 
cUnit.instructionSet = dvmCompilerInstructionSet (&cUnit) ; 
/* Convert MIR to LIR, etc. */ 
dvmCompilerMIR2LIR (&cUnit) ; 
/* Convert LIR into machine code. */ 
dvmCompilerAssembleLIR(&cUnit, info) ; 
if (cUnit.printMe) { 
if (cUnit.halveInstCount) { 
LOGD("Assembler aborted"); 
) eise ( 
dvmCompilerCodegenDump (&cUnit) ; 
) 


LOGD("End $s$s, %d Dalvik instructions", 
desc-»method-»clazz-»descriptor, desc-»method-»name, 
cUnit.numInsts); 

) 
/* Reset the compiler resource pool */ 
dvmCompilerArenaReset () ; 
/* Free the bit vector tracking null-checked registers */ 
dvmFreeBitVector (cUnit .registerScoreboard.nullCheckedRegs) ; 
if (!cUnit.halveInstCount) { 
/* Success */ 

methodStats-»nativeSize «- cUnit.totalSize; 

return info-»codeAddress !- NULL; 
/* Halve the instruction count and retry again */ 
) eise ( 

return dvmCompileTrace (desc, cUnit.numInsts / 2, info); 
} 
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(3) 通过 parseInsn0 解 析 dex 字 节 码 ， 实 现代 码 如 下 。 


static inline int parseInsn(const u2 *codePtr, DecodedInstruction *decInsn, 
bool printMe) 
{ 
u2 instr = *codePtr; 
OpCode opcode = instr & Oxff; 
int insnWidth; 


// Don't parse instruction data 
if (opcode == OP_NOP && instr != 0) { 
return 0; 
} else { 
insnWidth = gDvm.instrWidth [opcode] ; 
if (insnWidth < 0) { 
insnWidth = -insnWidth; 
} 


) 


dexDecodeInstruction(gDvm.instrFormat, codePtr, decInsn); 
if (printMe) ( 

LOGD("$p: %#06x %s\n", codePtr, opcode, getOpcodeName (opcode)); 
} 


return insnWidth; 


} 


(4) 使 用 CompilerMethodStats *analyzeMethodBody0 解 析 被 追踪 过 的 方法 判断 其 是 否 被 调 
用 ， 分 析出 热 路 径 (hot method)。 实 现代 码 如 下 。 


static CompilerMethodstats *analyzeMethodBody (const Method *method) 
{ 
const DexCode *dexCode = dvmGetMethodCode (method); 
const u2 *codePtr = dexCode->insns; 
const u2 *codeEnd - dexCode-»insns « dexCode-»insnsSize; 
int insnSize - 0; 
int hashValue = dvmComputeUtf8Hash (method->name) ; 
CompilerMethodStats dummyMethodEntry; // For hash table lookup 
CompilerMethodStats *realMethodEntry; // For hash table storage 
/* For lookup only */ 
dummyMethodEntry.method - method; 
realMethodEntry = dvmHashTableLookup (gDvmJit.methodStatsTable, hashValue, 
&dummyMethodEntry, 
(HashCompareFunc) compareMethod, 
false); 
/* Part of this method has been compiled before - just return the entry */ 
if (realMethodEntry !- NULL) { 
return realMethodEntry; 
} 


/* 
* First time to compile this method - set up a new entry in the hash table 
E 
realMethodEntry - 
(CompilerMethodStats *) calloc(1, sizeof (CompilerMethodStats)); 


> 
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realMethodEntry-»method = method; 
dvmHashTableLookup (gDvmJit.methodStatsTable, hashValue, 
realMethodEntry, 
(HashCompareFunc) compareMethod, 
true); 
/* Count the number of instructions */ 
while (codePtr < codeEnd) { 
DecodedInstruction dalvikInsn; 
int width - parseInsn(codePtr, &dalvikInsn, false); 
/* Terminate when the data section is seen */ 
if (width -- 0) 
break; 
insnSize «- width; 
codePtr += width; 
} 
realMethodEntry-»dalvikSize = insnSize * 2; 
return realMethodEntry; 


12.4.4 BasicBlock 处 理 


文件 vm\compiler\IntermediateRep.c 的 功能 是 ， 申 请 BasicBlock 空间 ， 组 织 MIR instruction 
到 BasicBlock 中 尾 或 头 的 位 置 以 及 LIR instruction 到 LIR 链表 中 的 位 置 。 主 要 代码 如 下 。 


#include "Dalvik.h" 
#include "CompilerInternals.h" 


/* Allocate a new basic block */ 

BasicBlock *dvmCompilerNewBB(BBType blockType) 

{ 
BasicBlock *bb = dvmCompilerNew(sizeof (BasicBlock), true) ; 
bb->blockType = blockType; 
return bb; 


} 


/* Insert an MIR instruction to the end of a basic block */ 
void dvmCompilerAppendMIR(BasicBlock *bb, MIR *mir) 


{ 
if (bb->firstMIRInsn == NULL) { 
assert (bb->firstMIRInsn == NULL); 
bb->lastMIRInsn = bb->firstMIRInsn = mir; 
mir->prev = mir->next = NULL; 
} else { 
bb-»lastMIRInsn-»next = mir; 
mir->prev = bb->lastMIRInsn; 
mir->next = NULL; 
bb->lastMIRInsn = mir; 
} 
} 
/* 
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* Append an LIR instruction to the LIR list maintained by a compilation 
* unit 
*/ 
void dvmCompilerAppendLIR (CompilationUnit *cUnit, LIR *lir) 
{ 
if (cUnit->firstLIRInsn == NULL) { 
assert (cUnit->lastLIRInsn == NULL) ; 
cUnit->lastLIRInsn = cUnit->firstLIRInsn = lir; 
lir->prev = lir->next = NULL; 
} else { 
cUnit->lastLIRInsn->next = lir; 
lir->prev = cUnit->lastLIRInsn; 
lir->next = NULL; 
cUnit->lastLIRInsn = lir; 


* Insert an LIR instruction before the current instruction, which cannot be the 
* first instruction. 


* prevLIR <-> newLIR <-> currentLIR 
Hf 
void dvmCompilerInsertLIRBefore(LIR *currentLIR, LIR *newLIR) 


{ 


if (currentLIR->prev == NULL) 
dvmAbort () ; 
LIR *prevLIR = currentLIR->prev; 


prevLIR->next = newLIR; 
newLIR->prev = prevLIR; 
newLIR-»next = currentLIR; 
currentLIR-»prev - newLIR; 


124.5 内存 初 始 化 


文件 vm\compiler\Utility.c 的 功能 是 实现 内 存 初始 化 工作 ， 具 体 来 说 有 如 下 三 个 功能 : 
Q ”实现 compilation tasks 内 存 的 分 配 。 

Q ”实现 对 GrowableList 的 管理 。 

OQ HT compilation unit 调试 等 一 系列 工具 函数 。 

文件 Utility.c 的 主要 代码 如 下 。 

#include "Dalvik.h" 

#include "CompilerInternals.h" 


Static ArenaMemBlock *arenaHead, *currentArena; 
Static int numArenaBlocks; 


/* Allocate the initial memory block for arena-based allocation */ 
bool dvmCompilerHeapInit (void) 


p> 


} 
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assert (arenaHead == NULL); 
arenaHead = 
(ArenaMemBlock *) malloc (sizeof (ArenaMemBlock) + ARENA DEFAULT SIZE); 
if (arenaHead == NULL) { 
LOGE("No memory left to create compiler heap memory\n") ; 
return false; 
} 
currentArena = arenaHead; 
currentArena->bytesAllocated = 0; 
currentArena->next = NULL; 
numArenaBlocks = 1; 
return true; 


/* Arena-based malloc for compilation tasks */ 
void * dvmCompilerNew(size_t size, bool zero) 


{ 


size = (size + 3) & ~3; 


retry: 


/* Normal case - space is available in the current page */ 
if (size + currentArena->bytesAllocated <= ARENA DEFAULT SIZE) { 
void *ptr; 
ptr = &currentArena->ptr [currentArena->bytesAllocated] ; 
currentArena->bytesAllocated += size; 
if (zero) { 
memset (ptr, 0, size); 
} 
return ptr; 
} else { 
/* 
* See if there are previously allocated arena blocks before the last 
* reset 
E 
if (currentArena-»next) ( 
currentArena - currentArena-»next; 
goto retry; 
} 
/* 
* If we allocate really large variable-sized data structures that 
* could go above the limit we need to enhance the allocation 
* mechanism. 
*/ 
if (size > ARENA DEFAULT_SIZE) { 
LOGE ("Requesting %d bytes which exceed the maximal size allowed\n", 
size); 
return NULL; 
} 
/* Time to allocate a new arena */ 
ArenaMemBlock *newArena = (ArenaMemBlock *) 
malloc (sizeof (ArenaMemBlock) + ARENA DEFAULT SIZE); 
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newArena-»bytesAllocated - 0; 
newArena-»next - NULL; 
currentArena-»next - newArena; 
currentArena - newArena; 
numArenaBlocks++; 
LOGD("Total arena pages for JIT: %d", numArenaBlocks) ; 
goto retry; 
} 
return NULL; 


} 


/* Reclaim all the arena blocks allocated so far */ 
void dvmCompilerArenaReset (void) 
{ 
ArenaMemBlock *block; 
for (block = arenaHead; block; block = block->next) { 
block->bytesAllocated = 0; 


} 


currentArena = arenaHead; 
} 
/* Growable List initialization */ 
void dvmInitGrowableList (GrowableList *gList, size t initLength) 
{ 
gList-»numAllocated = initLength; 
gList-»numUsed - 0; 
gList-»elemList - (void **) dvmCompilerNew(sizeof(void *) * initLength, 
true); 
} 
/* Expand the capacity of a growable list */ 
static void expandGrowableList (GrowableList *gList) 
{ 
int newLength = gList->numAllocated; 
if (newLength < 128) { 
newLength <<= 1; 
} else { 
newLength += 128; 
} 
void *newArray = dvmCompilerNew(sizeof(void *) * newLength, true); 
memcpy(newArray, gList-»elemList, sizeof(void *) * gList-»numAllocated); 
gList-»numAllocated - newLength; 
gList-»elemList - newArray; 
} 
/* Insert a new element into the growable list */ 
void dvmInsertGrowableList (GrowableList *gList, void *elem) 
{ 
if (gList->numUsed gList->numAllocated) { 
expandGrowableList (gList); 


} 


gList->elemList [gList->numUsed++] = elem; 


} 


/* Debug Utility - dump a compilation unit */ 
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void dvmCompilerDumpCompilationUnit (CompilationUnit *cUnit) 
{ 
int i; 
BasicBlock *bb; 
LOGD("$d blocks in total\n", cUnit->numBlocks) ; 
for (i = 0; i < cUnit->numBlocks; i++) { 
bb = cUnit->blockList [i] ; 
LOGD("Block %d (insn %04x - %04x%s)\n", 
bb->id, bb->startOffset, 
bb->lastMIRInsn ? bb->lastMIRInsn->offset : bb->startOffset, 
bb-»lastMIRInsn ? "" : " empty"); 
if (bb->taken) { 
LOGD(" Taken branch: block %d (%04x)\n", 
bb->taken->id, bb->taken->startOffset) ; 
} 
if (bb->fallThrough) { 
LOGD(" Fallthrough : block %d (%04x)\n", 
bb->fallThrough->id, bb->fallThrough->startOffset) ; 


/* 
* dvmHashForeach callback. 
ey 
static int dumpMethodStats(void *compilerMethodStats, void *totalMethodStats) 
{ 
CompilerMethodStats *methodStats = 
(CompilerMethodStats *) compilerMethodStats; 
CompilerMethodStats *totalStats - 
(CompilerMethodStats *) totalMethodStats; 
const Method *method - methodStats-»method; 
totalStats-»dalvikSize += methodStats-»dalvikSize; 
totalStats-»compiledDalvikSize «- methodStats-»compiledDalvikSize; 
totalStats-»nativeSize «- methodStats-»nativeSize; 
/* Enable the following when fine-tuning the JIT performance */ 
Hif 0 
int limit - (methodStats-»dalvikSize »» 2) * 3; 
/* If over 3/4 of the Dalvik code is compiled, print something */ 
if (methodStats-»compiledDalvikSize »- limit) { 

LOGD("Method stats: %s%s, %d/%d (compiled/total Dalvik), $d (native)", 
method->clazz->descriptor, method->name, 
methodStats->compiledDalvikSize, 
methodStats->dalvikSize, 
methodStats->nativeSize) ; 

} 
#endif 
return 0; 
} 
/* 
* Dump the current stats of the compiler, including number of bytes used in 
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* the code cache，arena size，and work queue length，and various JIT stats . 


a 


void dvmCompilerDumpStats (void) 


{ 


} 


CompilerMethodStats totalMethodStats; 


memset (&totalMethodStats, 0, sizeof (CompilerMethodStats) ) ; 
LOGD("%d compilations using td + td bytes", 

gDvmJit .numCompilations, 

gDvmJit.templateSize, 

gDvmJit.codeCacheByteUsed - gDvmJit.templateSize); 
LOGD("Compiler arena uses %d blocks (%d bytes each)", 

numArenaBlocks, ARENA DEFAULT SIZE); 


LOGD("Compiler work queue length is %d/%d", gDvmJit.compilerQueueLength, 


gDvmJit.compilerMaxQueued); 

dvmJitStats(); 

dvmCompilerArchDump () ; 

dvmHashForeach (gDvmJit .methodStatsTable, dumpMethodStats, 

&totalMethodStats) ; 

LOGD ("Code size stats: %d/td (compiled/total Dalvik), $d (native)", 
totalMethodStats.compiledDalvikSize, 
totalMethodStats.dalvikSize, 
totalMethodStats.nativeSize) ; 


12.4.6 对 JIT 源码 的 总 结 


经 过 前 面 对 JIT 编译 源码 的 讲解 ， 己 经 对 此 编译 方式 有 了 一 个 大 体 的 了 解 。 


出 如 下 从 主 函数 到 JIT 的 调用 流程 。 


@> 


a) 
Q) 
G) 
(4) 
G) 
(6) 
(7) 
(8) 
(9) 


AndroidRuntime::Start() 。 
startVm(). 

. JNIEnv::CallStaticVoidMethod() 。 
Check CallStaticVoidMethodV() . 
CallStaticVoidMethodV() 。 
dvmCallMethodV(). 
dvminterpret() 。 

dvmMterpStd() 。 

dalvik mterp()- 


(10) Dalvik java lang reflect Method invokeNative()- 

(11) dvmInvokeMethod() 。 

(12) dvmlnterpret(). 

(13) dvmJitCheckTraceRequest() 。 

(14) dvmjitLookupAndAdd(). 

从 目前 JIT 的 工作 调研 结果 看 ， 可 以 划分 为 3 个 大 的 方面 ， 分 别 是 汇编 部 分 的 移植 、C 部 分 
的 移植 以 及 Dalvik 虚拟 机 调试 。 之 所 以 将 Dalvik 虚拟 机 调试 作为 一 个 大 的 方面 ， 原 因 有 三 个 。 


由 此 可 以 总 结 


口 


口 


口 
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JIT 的 移植 的 工作 量 较 大 , 涉及 代码 较 多 , 找到 一 个 好 的 调试 方法 对 工作 的 进展 与 完成 
有 着 举足轻重 的 作用 。( 必 须 性 ) 

在 调研 过 程 中 发 现 ，Google 公司 的 一 些 官方 文档 中 涉及 Dalvik 虚拟 机 的 调试 ， 并 有 简 
单 的 实例 。 

在 Dalvik 虚拟 机 源码 中 天 生 就 有 调试 的 部 分 ， 包 括 : dalvik/tools/ 下 的 gdbjithelper 与 
dmtracedump, dalvik/vm 下 的 Debug.c, vm/mterp/armvSte 中 的 debug.c, /dalvik/vm/ 
compiler/Loop.c 中 用 于 调试 的 函数 以 及 MIPS 中 的 大 量 使 用 的 assert( 。 
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所 谓 异常 ， 是 指 程序 在 运行 时 发 生 的 错误 或 者 不 正常 的 情况 。 异 常 对 程序 员 来 说 是 一 件 很 
麻烦 的 事情 ， 需 要 程序 员 来 进行 检测 和 处 理 。 但 是 无 论 是 Java 还 是 Dalvik 虚拟 机 ， 都 非常 人 性 
化 ， 可 以 自动 检测 异常 ， 并 对 异常 进行 捕获 ， 并 且 通 过 程序 可 以 对 异常 进行 处 理 。 在 本 章 的 内 
容 中 ， 将 详细 讲解 Java 虚拟 机 和 Dalvik 虚拟 机 处 理 异常 的 知识 。 


13.1 Java 中 的 异常 处 理 


在 程序 设计 里 ， 异 常 处 理 就 是 提前 编写 程序 处 理 可 能 发 生 的 意外 ， 如 聊天 工具 需要 连接 网 
络 ， 首 先 就 是 检查 网 络 ， 对 网 络 的 各 个 程序 进行 捕获 ， 然 后 对 各 个 情况 编写 程序 。 如 登录 聊天 
系统 后 突然 发 现 没有 登录 网 络 ， 异 常 可 以 向 用 户 提示 “网 络 有 问题 ， 请 检查 联网 设备 ”， 这 种 
人 文化 的 提醒 就 是 通过 异常 处 理 来 实现 的 。 


13.1.1 认识 异常 


在 编程 过 程 中 ， 首 先 应 当 尽 可 能 地 去 避免 错误 和 异常 发 生 ， 对 于 不 可 避免 、 不 可 预测 的 情 
况 则 在 考虑 异常 发 生 时 如 何 处 理 。Java 中 的 异常 用 对 象 来 表示 。Java 对 异常 的 处 理 是 按 异 常 分 
类 处 理 的 。 异 常 的 种 类 很 多 ， 每 种 异常 都 对 应 一 个 类 型 (class)， 每 个 异常 都 对 应 一 个 异常 (类 的 ) 
对 象 。 

那么 究竟 异常 的 对 象 从 哪里 来 呢 ? 异常 主要 有 两 个 来 源 ， 一 是 Java 运行 
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运行 时 自动 抛 出。 程序 开发 人 员 也 可 以 通过 throws 关键 字 在 方法 上 声明 该 方法 要 抛 出 异常 ， 然 
后 在 方法 内 部 通过 throw 抛 出 异常 对 象 。finally 语句 块 会 在 方法 执行 retum 之 前 执行 ，Java 处 理 
异常 的 一 般 结构 如 下 。 


try 


程序 代码 

}catch (异常 类 型 1 异常 的 变量 名 1) 
{ 

程序 代码 

}catch (异常 类 型 2 异常 的 变量 名 2) 
{ 

程序 代码 

}finally 

{ 

程序 代码 

} 


13.1.2 Java 的 异常 处 理 机 制 


在 编写 Java 程序 时 ， 要 尽量 做 到 程序 的 健壮 性 。 所 谓 程序 的 健壮 性 ， 是 指 程序 在 多 数 情 况 
下 能 够 正常 运行 ， 返 回 预期 的 正确 结果 ; 如 果 偶 尔 遇 到 异常 情况 ， 程 序 也 能 采取 周到 的 解决 措 
施 。 而 不 健壮 的 程序 则 没有 事先 充分 预计 到 可 能 出 现 的 异常 ， 或 者 没有 提供 强 有 力 的 异常 解决 
措施 ， 导 致 程序 在 运行 时 ， 经 常 莫名 其 妙 地 终止 ， 或 者 返回 错误 的 运行 结果 ， 而 且 难 以 检测 出 
现 异 常 的 原因 。 

Java 虚拟 机 用 方法 调用 栈 (method invocation stack) 来 跟踪 一 系列 的 方法 调用 过 程 。 该 堆栈 保 
存 了 每 个 调用 方法 的 本 地 信息 (比如 方法 的 局 部 变量 )。 当 一 个 新 方法 被 调用 时 ，Java 虚拟 机 把 描 
述 该 方法 的 栈 结构 置 入 栈 项 ， 位 于 栈 项 的 方法 为 正在 执行 的 方法 。 如 图 13-1 所 示 描 述 了 方法 调 
用 栈 的 结构 ， 图 中 方法 的 调用 顺序 为 : main0 方 法 调用 methodBQ77 iX, methodBQ 77 3: Vl HH] 


methodA() 方 法 。 
栈 顶 部 的 方法 是 正在 执 
行 的 方法 方法 methodA0 的 栈 结构 


方法 methodBO 的 栈 结构 


个 


方法 main0 的 栈 结构 


图 13-1 Java 虚拟 机 的 方法 调用 栈 
当 方 法 methodBO 调 用 方法 methodAO 时 ， 如 果 方 法 中 的 代码 块 可 能 抛 出 异常 ， 则 有 如 下 两 
种 处 理 办 法 。 
(1) 如 果 当 前 方法 有 能 力 自 己 解 决 异 常 ， 就 在 当前 方法 中 通过 try-catch 语句 捕获 并 处 理 异 
常 ， 例 如 下 面 的 代码 。 
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public void methodA(int status){ 
try{ 
// 以 下 代码 可 能 会 抛 出 SpecialException 
if (status==-1) 
throw new SpecialException ("Monster"); 
}catch (SpecialException e) { 
处 理 异 党 
} 
} 


(2) 如 果 当 前 方法 没有 能 力 自己 解决 异常 ， 就 在 方法 的 声明 处 通过 throws 语句 声明 抛 出 异 
例如 下 面 的 代码 。 
public void methodA(int status) throws SpecialException{ 

// 以 下 代码 可 能 会 抛 出 SpecialException 

if (status==-1) 


throw new SpecialException("Monster"); 


} 
当 一 个 方法 正常 执行 完毕 ，Java 虚拟 机 会 从 调用 栈 中 弹出 该 方法 的 栈 结构 ， 然 后 继续 处 理 


前 一 个 方法 。 如 果 在 执行 方法 的 过 程 中 抛 出 异常 ，Java 虚拟 机 必须 找到 能 捕获 该 异常 的 catch 代 
码 块 。 它 首先 察看 当前 方法 是 否 存在 这 样 的 catch 代码 块 ， 如 果 存 在 ， 就 执行 该 catch 代码 块 ; 
ATM, Java 虚拟 机 会 从 调用 栈 中 弹出 该 方法 的 栈 结构 , 继续 到 前 一 个 方法 中 查找 合适 的 catch 代 


码 块 。 


S 


例如 ， 当 方法 methodAO 抛 出 SpecialException 异常 时 ， 如 果 在 该 方法 中 提供 了 捕获 
pecialException 的 catch 代码 块 ， 就 执行 这 个 异常 处 理 代码 块 。 如 果 方 法 methodA0 未 捕获 该 异 


常 ， 而 是 采用 第 二 种 方式 声明 抛 出 SpecialException， 那 么 Java 虚拟 机 的 处 理 流程 将 退回 到 上 层 
调用 方法 methodBO, 再 察看 方法 methodBO 中 有 没有 捕获 SpecialException。 如 果 在 方法 methodBO 


q 


pb 存在 捕获 该 异常 的 catch 代码 块 ， 就 执行 这 个 catch 代码 块 ， 此 时 定义 方法 methodBO 的 代码 


如 下 。 


public void methodB (int status){ 
try{ 

methodA (status) ; 
}eatch(SpecialException e) { 

处 理 异 党 
} 

} 


由 此 可 见 ， 在 回溯 过 程 中 ， 如 果 Java 虚拟 机 在 某 个 方法 中 找到 了 处 理 该 异常 的 代码 块 ， 则 


该 方法 的 栈 结构 将 成 为 栈 顶 元 素 ， 程 序 流程 将 转 到 该 方法 的 异常 处 理 代码 部 分 继续 执行 。 


如 果 方 法 methodBO 也 没有 捕获 SpecialException， 而 是 声明 抛 出 该 异常 ， 那 么 Java 虚拟 机 


的 处 理 流 程 将 退回 到 main0 方 法 ， 此 时 定义 方法 methodBO 的 代码 如 下 。 


> 


public void methodB (int status) throws SpecialException{ 
methodA (status); 


} 
当 Java 虚拟 机 追溯 到 调用 栈 的 最 底部 的 方法 ， 如 果 仍 然 没 有 找到 处 理 该 异常 的 代码 块 ， 将 
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调用 异常 对 象 的 printStackTrace( 方 法 ， 打 印 来 自 方法 调用 栈 的 异常 信息 ， 随 后 整个 应 用 程序 被 
终止 。 请 读者 看 第 一 段 演示 代码 ， 具 体 代 码 如 下 。 


public class Sample( 

public void methodA(int status)throws SpecialException{ 
if(status---1) 

throw new SpecialException ("Monster"); 
System.out.println("methodA"); 


} 


public void methodB(int status)throws SpecialException{ 
methodA (status); 
System.out.println("methodB"); 

} 

public static void main(String args[])throws SpecialException{ 
new Sample().methodB(-1); 

} 
} 


在 上 述 代 码 中 ， 类 SpecialException 表示 某 一 种 异常 。 运 行 上 述 代码 后 会 打印 输出 如 下 异常 


Exception in thread "main" SpecialException: Monster 
at Sample.methodA (Sample .java:4) 

at Sample.methodB (Sample.java:10) 

at Sample.main(Sample.java:15) 


请 读者 再 看 第 二 段 演示 代码 ， 这 段 代码 是 前 面 第 一 段 代 码 的 源 程 序 ， 具 体 代码 如 下 。 
public class SpecialException extends Exception{ 
public SpecialException(){} 


public SpecialException(String msg) { 
super (msg) ; 
} 


13.1.3 Java 提供 的 异常 处 理 类 


在 Java 中 有 一 个 lang 包 ， 在 此 包 里 面 有 一 个 专门 处 理 异 常 的 类 一 一 Throwable， 此 类 是 所 
有 异常 的 父 类 ， 每 一 个 异常 的 类 都 是 它 的 子 类 。 其 中 Error 和 Exception 这 两 个 类 十 分 重要 ， 用 
得 也 较 多 ， 前 者 是 用 来 定义 那些 通常 情况 下 不 希望 被 捕获 的 异常 ， 而 后 者 是 程序 能 够 捕获 的 异 
常情 况 。Java 中 常用 异常 类 的 信息 如 表 13-1 所 示 。 


表 13-1 Java 中 的 异常 类 


异常 类 名 称 异常 类 含义 
ArithmeticExeption 算术 异常 类 
ArratIndexOutOfBoundsExeption | 数组 小 标 越界 异常 类 


ArrayStroeException 将 与 数组 类 型 不 兼容 的 值 赋值 给 数组 元 素 时 抛 出 的 异常 
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Er 
异常 类 名 称 异常 类 含义 

ClassCastException 类 型 强制 转换 异常 类 
ClassNotFoundException 为 找到 相应 大 类 异常 
EOFEException 文件 已 结束 异常 类 
FileNotFoundException 文件 未 找到 异常 类 
IllegalAccessException 访问 某 类 被 拒绝 时 抛 出 的 异常 类 

m . 试图 通过 newInstance() 方 法 创建 一 个 抽象 类 或 抽象 接口 的 实例 时 抛 
InstantiationException 

出 异常 类 

IOEException 输入 输出 抛 出 异常 类 
NegativeArraySizeException 建立 元 素 个 数 为 负数 的 异常 类 
NullPointerException 空 指针 异常 
NumberFormatException 字符 串 转换 为 数字 异常 类 
NoSuchFieldException 字段 未 找到 异常 类 
NoSuchMethodException 方法 未 找到 异常 类 


SecurityException 


SQLException 


小 应 用 程序 执行 浏览 器 的 安全 设置 禁止 动作 时 抛 出 的 异常 类 
操作 数据 库 异 常 类 


StringIndexOutOfBoundsException | 字符 串 索 引 超出 范围 异常 类 


13.2 ”处 理 Java 异常 的 方式 


Java 的 异常 处 理 可 以 让 程序 具有 更 好 的 容错 性 ， 程 序 更 加 健壮 。 当 程序 运行 出 现 意外 情形 
时 ， 系 统 会 自动 生成 一 个 Exception 对 象 来 通知 程序 ， 从 而 实现 将 “业务 功能 实现 代码 ”和 “和 错 
误 处 理 代 码 ” 分 离 ， 提 供 更 好 的 可 读 性 。Java 中 异常 处 理 方式 有 try/catch 捕获 异常 、throws 声 
明 异 常 和 throw 抛 出 异常 等 ， 在 出 现 异 常 后 可 以 使 用 上 述 方式 直接 捕获 并 处 理 ， 也 可 以 先 不 处 
理 而 是 把 它 抛 用 上 面 的 调用 者 。 


使 用 try...catch 处 理 异 常 


在 编写 Java 程序 , 需要 处 理 的 异常 一 般 放 在 try 代码 块 里 , 然后 创建 catch 代码 块 里 。 在 Java 
语言 中 ， 用 try-catch 语句 来 捕获 异常 的 格式 如 下 。 


13.2.1 


try { 

可 能 会 出 现 异常 情况 的 代码 
}catch (SQLException e) { 

处 理 操纵 数据 库 出 现 的 异常 
}catch (IOException e) { 

处 理 操纵 输入 流 和 输出 流出 现 的 异常 
} 


对 于 以 上 代码 ， 当 程序 操纵 数据 库 出 现 异 常 时 ，Java 虚拟 机 将 创建 一 个 包含 了 异常 信息 的 
SQLException 对 象 。catch (SQLException e) 语 句 中 的 引用 变量 e 引用 这 个 SQLException 对 象 。 


o> 
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13.22 ”在 异常 中 使 用 finally 关键 字 


使 用 try...catch 处 理 异常 时 加 上 关键 字 finally, 可 以 将 增 大 处 理 异 常 的 功能 。 不管 程 序 有 无 
异常 发 生 都 将 执行 finally 语句 块 的 内 容 ， 这 样 使 得 一 些 不 管 在 任何 情况 下 都 必须 执行 的 步 又 被 
执行 ， 可 以 保证 程序 的 健壮 性 。 

由 于 异常 会 强制 中 断 正常 流程 ,这 会 使 得 某 些 不 管 在 任何 情况 下 都 必须 执行 的 步骤 被 忽略 ， 
从 而 影响 程序 的 健壮 性 。 例 如 老 管 开 了 一 家 小 店 ， 在 店 里 上 班 的 正常 流程 为 : 每 天 9 点 开门 营 
业 ， 工 作 8 个 小 时 ，17 点 关门 下 班 。 异 常 流程 为 : 老 管 在 工作 时 突然 感到 身体 不 适 ， 于 是 提前 
下 班 。 我 们 可 以 编写 如 下 work0 方 法 表示 老 管 的 上 班 动作 。 

public void work()throws LeaveEarlyException { 

t: 

s AINE 

每 天 工作 8 个 小 时 // 可 能 会 抛 出 DiseaseException 异常 

下 午 17 关 门下 班 

}catch (DiseaseException e) { 
throw new LeaveEarlyException(); 
} 

} 

假如 老 管 在 工作 时 突然 感到 身体 不 适 ， 于 是 提前 下 班 ， 那 么 流程 会 跳 转 到 catch 代码 块 ， 这 
意味 着 关门 的 操作 不 会 被 执行 ， 这 样 的 流程 显然 是 不 安全 的 ， 必 须 确保 关门 的 操作 在 任何 情况 
下 都 会 被 执行 。 在 程序 中 应 该 确保 占用 的 资源 被 释放 ， 比 如 及 时 关闭 数据 库 连 接 ， 关 闭 输 入 流 ， 
或 者 关闭 输出 流 。finally 代码 块 能 保证 特定 的 操作 总 是 会 被 执行 ， 其 语法 格式 如 下 。 


public void work()throws LeaveEarlyException ( 


try{ 
9 点 开门 营业 
每 天 工作 8 个 小 时 // 可 能 会 抛 出 DiseaseException 异常 
}catch (DiseaseException e) { 
throw new LeaveEarlyException(); 
}finally{ 
下 午 17 关门 下 班 
} 
} 


由 此 可 见 ， 在 Java 程序 中 ， 不 管 ty 代码 块 中 是 否 出 现 异常 ， 都 会 执行 finally 代码 块 。 
13.23 ”访问 异常 信息 


如 果 Java 程序 要 在 catch 块 中 访问 异常 对 象 的 相关 信息 ， 可 以 通过 调用 catch 块 后 的 异常 形 
参 的 方法 来 获得 。 当 Java 程序 在 运行 中 决定 调用 某 个 catch 块 来 处 理 该 异常 对 象 时， 会 将 该 异 
常 对 象 赋 给 catch 块 后 的 异常 形 参 ， 程 序 就 可 以 通过 该 参数 来 获得 该 异常 的 相关 信息 。 

在 所 有 的 Java 异常 对 象 中 都 包含 了 如 下 常用 方法 。 

O getMassage(): 返回 该 异常 的 详细 描述 字符 串 。 

O printStackTrace(: 将 该 异常 的 跟踪 栈 信息 输出 到 标准 错误 输出 。 
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O printStackTrace(PrintStream s): 将 该 异常 的 跟踪 栈 信息 输出 到 指定 输出 。 
O getStackTraceQ): 返回 该 异常 的 跟踪 栈 信息 。 


13.24 WERF 


在 很 多 时 候 程序 对 异常 暂时 不 会 处 理 ， 只 是 将 异常 抛 出 去 交 给 父 类 ， 让 父 类 处 理 异常 。 在 
Java 程序 中 抛 出 异常 的 这 一 做 法 在 编程 过 程 中 经 常用 到 ， 本 节 将 带领 大 家 一 起 领略 Java FEF IA 
出 异常 的 基本 知识 。 


1. 使 用 throws 抛 出 异常 


抛 出 异常 是 指 一 个 方法 不 处 理 这 个 异常 ， 而 是 调用 层次 向 上 传递 ， 谁 调用 这 个 方法 ， 这 个 
异常 就 由 谁 处 理 。 在 Java 中 可 以 使 用 throws 来 抛 出 异常 ， 具 体格 式 如 下 。 

void methodName (int a)throws Exception 

{ 

} 

如 果 一 个 方法 可 能 会 出 现 异 常 ， 但 没有 能 力 处 理 这 种 异常 ， 可 以 在 此 方法 声明 处 用 throws 
子 句 来 声明 抛 出 异常 ， 例 如 汽车 在 运行 时 可 能 会 出 现 故 障 ， 汽 车 本 身 没 办 法 处 理 这 个 故障 ， 因 
此 类 Car 的 run() 方 法 声明 抛 出 CarWrongException 异常 : 

public void run()throws CarWrongException{ 

if (车 子 无 法 刹车 ) throw new CarWrongException(" 车 子 无 法 刹车 ") ; 

if (发 动机 无 法 启动 ) throw new CarWrongException ("发 动机 无 法 启动 ") ; 
} 

类 Worker 的 gotoWork0 方 法 调用 以 上 mn0 方 法 , gotoWork0 方 法 捕获 并 处 理 CarWrongException 
异常 , 在 异常 处 理 过 程 中 ,又 生成 了 新 的 迟到 异常 LateException，gotoWork0 方 法 本 身 不 会 再 处 
理 LateExeption， 而 是 声明 抛 出 LateExeption 异常 。 

public void gotoWork()throws LateException{ 

try{ 
car.run(); 


}catch(CarWrongException e){ // 处 理 车 子 出 故障 的 异常 
// 找 人 修 车 子 


177 创建 -个 LateException 对 象 ， 并 将 其 抛 出 

throw new LateException(" 因 为 车 子 出 故障 ， 所 以 迟到 了 ") ; 
} 

} 


谁 会 来 处 理 类 Worker 的 gotoWork( 方 法 抛 出 的 LateException WE? 显然 是 职工 的 老板 ， 如 
果 某 职工 上 班 迟 到 ， 那 就 扣 他 的 工资 。 在 一 个 方法 可 能 会 出 现 多 种 异常 ， 使 用 throws 子 句 可 以 
声明 抛 出 多 个 异常 ， 例 如 下 面 的 代码 。 


public void method() throws SQLException, IOException{...} 
2. 使 用 throw 抛 出 异常 
在 Java 中 也 可 以 使 用 关键 字 throw 抛 出 异常 ， 把 它 抛 给 上 一 级 调用 的 异常 ， 抛 出 的 异常 可 


Q 
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以 是 异常 引用 ， 也 可 以 是 异常 对 象 。throw 语句 用 于 抛 出 异常 ， 例 如 以 下 代码 表明 汽车 在 运行 时 
会 出 现 故障 。 
public void run()throws CarWrongException{ 
if (车 子 无 法 刹车 ) 
throw new CarWrongException (" 车 子 无 法 刹车 ") ; 
if (发 动机 无 法 启动 ) 
throw new CarWrongException (" 发 动机 无 法 启动 ") ; 
} 
值得 注意 的 是 ， 由 throw 语句 抛 出 的 对 象 必须 是 java lang. Throwable 类 或 者 其 子 类 的 实例 。 
例如 下 面 的 代码 是 不 合法 的 。 


throw new String(" 有 人 溺水 啦 ， 救 命 啊 !") ; // 编 译 错误 ，String 类 不 是 异常 类 型 
关键 字 throws 和 throw 尽管 只 有 一 个 字母 之 差 ， 却 有 着 不 同 的 用 途 ， 注 意 不 要 将 两 者 混淆 。 


13.25 自 定义 异常 


在 前 面 讲解 的 这 么 多 异常 ， 都 是 系统 自 带 ， 系 统 自己 处 理 的， 但 是 在 很 多 时 候 需 要 程序 员 
自 定义 异常 。 在 Java 程序 中 要 想 创建 自 定义 异常 ， 需 要 继承 类 Throwable 或 其 子 类 Exception. 
自 定义 异常 让 系统 把 它 看 成 一 种 异常 来 对 待 ， 由 于 自 定义 异常 继承 Throwable 类 ， 所 以 也 继承 
了 它 里 面 的 方法 。 

Throwable 是 java.lang 包 中 一 个 专门 用 来 处 理 异 常 的 类 。 它 有 两 个 子 类 ， 即 Error 和 
Exception， 分 别 用 来 处 理 两 组 异常 。 类 Error 和 Exception 的 具体 说 明 如 下 。 

(1) Eror: 用 来 处 理 程序 运行 环境 方面 的 异常 ， 比 如 ， 虚 拟 机 错误 、 装 载 错误 和 连接 错误 ， 
这 类 异常 主要 是 和 硬件 有 关 的 ， 而 不 是 由 程序 本 身 抛 出 的 。 

(2) Exception: 是 Throwable 的 一 个 主要 子 类 。Exception 下 面 还 有 子 类 ， 其 中 一 部 分 子 类 
分 别 对 应 于 Java 程序 运行 时 遇 到 的 各 种 异常 的 处 理 ， 其 中 包括 隐 式 异常 。 比 如 ， 程 序 中 除数 为 
0 引起 的 错误 、 数 组 下 标 越界 错误 等 ， 这 类 异常 也 称 为 运行 时 异常 ， 因 为 它们 虽然 是 由 程序 本 身 
引起 的 异常 ,但 不 是 由 程序 主动 抛 出 的 ， 而 是 在 程序 运行 中 产生 的 。Exception 子 类 下 面 的 另 一 
部 分 子 类 对 应 于 Java 程序 中 的 非 运行 时 异常 的 处 理 ， 这 些 异常 也 称 为 显 式 异 常 。 它 们 都 是 在 程 
序 中 用 语句 抛 出 、 并 且 也 是 用 语句 进行 捕获 的 ， 比 如 ， 文 件 没 找 到 引起 的 异常 、 类 没 找到 引起 
的 异常 等 。 

Throwable 类 及 其 子 类 中 主要 包括 如 下 方法 。 

O ArithmeticException: 由 于 除数 为 0 引起 的 异常 。 

O ArrayStoreException: 由 于 数组 存储 空间 不 够 引起 的 异常 。 

O ClassCastException: 当 把 一 个 对 象 归 为 某 个 类 ， 但 实际 上 此 对 象 并 不 是 由 这 个 类 创建 

的 ， 也 不 是 其 子 类 创建 的 ， 则 会 引起 异常 。 

口 IllegalMonitorStateException: 监控 器 状态 出 错 引起 的 异常 。 

口 NegativeArraySizeException: 数组 长 度 是 负数 ， 则 产生 异常 。 

Q NullPointerException: 程序 试图 访问 一 个 空 的 数组 中 的 元 素 或 访问 空 的 对 象 中 的 方法 

或 变量 时 产生 异常 。 
O OutofMemoryException: 用 new 语句 创建 对 象 时 ， 如 系统 无 法 为 其 分 配 内 存 空间 ， 则 
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产生 异常 。 

SecurityException: 由 于 访问 了 不 应 访问 的 指针 ， 使 安全 性 出 问题 而 引起 异常 。 
IndexOutOfBoundsExcention: 由 于 数组 下 标 越 界 或 字符 串 访 问 越界 引起 异常 。 
IOException: 由 于 文件 未 找到 、 未 打开 或 者 IO 操作 不 能 进行 而 引起 异常 。 
ClassNotFoundException: 未 找到 指定 名 字 的 类 或 接口 引起 异常 。 
CloneNotSupportedException: 程序 中 的 一 个 对 象 引 用 Object 类 的 clone 方法 ， 但 此 对 
象 并 没有 连接 Cloneable 接口 ， 从 而 引起 异常 。 

InterruptedException: 当 一 个 线程 处 于 等 待 状态 时 ， 另 一 个 线程 中 断 此 线程 ， 从 而 引起 
异常 。 

NoSuchMethodException: 所 调用 的 方法 未 找到 ， 引 起 异常 。 

Illegal AccessExcePtion: 试图 访问 一 个 非 public 方法 。 
StringIndexOutOfBoundsException: 访问 字符 串 序 号 越界 ， 引 起 异常 。 
ArrayIdexOutOfBoundsException: 访问 数组 元 素 下 标 越界 ， 引 起 异常 。 
NumberFormatException: 字符 的 UTF 代码 数据 格式 有 错 引起 异常 。 
IllegalThreadException: 线程 调用 某 个 方法 而 所 处 状态 不 适当 ， 引 起 异常 。 
FileNotFoundException: 未 找到 指定 文件 引起 异常 。 

EOFException: 未 完成 输入 操作 即 遇 文件 结束 引起 异常 。 


13.2.6 Java 异常 处 理 语句 的 规则 


异常 处 理 语句 主要 涉及 try、catch、finally、throw 和 throws 关键 字 ， 要 正确 使 用 它们 ， 就 
必须 遵守 必要 的 语法 规则 。 
(1) try 代码 块 不 能 脱离 catch 代码 块 或 finally 代码 块 而 单独 存在 。try 代码 块 后 面 至 少 有 一 
个 catch 代码 块 或 finally 代码 块 。 以 下 代码 会 导致 编译 错误 。 
public static void main(String args[])throws SpecialException{ 
Run Sample () .methodA(-1) ; 
System.out.println("main"); 


) // 编 译 错误 ， 不 允许 出 现 孤 立 的 try 代码 块 


ooooo 


口 
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System.out.println("Finally"); 


} 


Q) try 代码 块 后 面 可 以 有 零 个 或 多 个 catch 代码 块 ， 还 可 以 有 和 零 个 或 至 多 一 个 finally 代 
码 块 。 
(3) try 代码 块 后 面 可 以 只 跟 finally 代码 块 ， 例 如 : 


public static void main(String args[])throws SpecialException{ 
try{ 
new Sample() .methodA(-1) ; 
System.out .println ("main"); 
}finally{ 
System.out.println("Finally"); 
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4 “ty 代码 块 后 面 有 多 个 catch 代码 块 时 ，Java 虚拟 机 会 把 实际 抛 出 的 异常 对 象 依次 和 
各 个 catch 代码 块 声明 的 异常 类 型 匹配 ， 如 果 异 常 对 象 为 某 个 异常 类 型 或 其 子 类 的 实例 ， 就 执行 
这 个 catch 代码 块 ， 不 会 再 执行 其 他 的 catch 代码 块 。 在 以 下 代码 中 ，codel 语句 抛 出 
FileNotFoundException 异常 , FileNotFoundException 类 是 IOException 类 的 子 类 , 而 IOException 
类 是 Exception 的 子 类 。Java 虚拟 机 先 把 FileNotFoundException 对 象 与 IOException 类 匹配 ， 因 
此 ， 当 出 现 FileNotFoundException 时 ， 程 序 的 打印 结果 为 “IOException”。 


try{ 

codel; // 可 能 抛 出 FileNotFoundException 
}catch (SQLException e) { 

System.out .print1n ("SQLException"); 
}catch (IOException e) { 

System.out .print1n ("IOException") ; 
}catch (Exception e) { 

System.out .print1n ("Exception"); 


} 


在 以 下 程序 中 ， 如 果 出 现 FileNotFoundException, 4] E] 4i Jy “Exception” , LW 
FileNotFoundException 对 象 与 Exception 类 匹配 。 


try( 

codel; // 可 能 抛 出 FileNotFoundException 
}catch (SQLException e) { 

System.out .print1n ("SQLException") ; 
}catch (Exception e) { 

System.out .print1n ("Exception"); 


} 


(5) 如 果 一 个 方法 可 能 出 现 受 检查 异常 ， 要 么 用 try-catch 语句 捕获 ， 要 么 用 throws 子 句 声 
明 将 它 抛 出 ， 否 则 会 导致 编译 错误 。 例 如 下 面 的 方法 method10 声 明 抛 出 IOException， 它 是 受 检 
查 异 常 ， 其 他 方法 调用 method10 方 法 : 

void method1() throws IOException{} //# 


// 编 译 错误 ， 必 须 捕获 或 声明 抛 出 IOException 
void method2 () { 
method1 () ; 


} 


// 合 法 ， 声 明 抛 出 IOException 
void method3 () throws IOException { 
methodl(); 


} 


//#%, FAM Exception, IOException 是 Exception 的 子 类 
void method4()throws Exception { 
method1 () ; 


} 


// 合 法 ， 捕 获 IOException 
void methods () { 
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try{ 
methodi () ; 
}catch(IOException e)(..] 


} 


// 编 译 错误 ， 必 须 捕获 或 声明 抛 出 Exception 
void methode () { 
try{ 
method] () ; 
}catch (IOException e) {throw new Exception() ;} 


// 合 法 ， 声 明 抛 出 Exception 
void method7()throws Exception{ 


try{ 
method] () ; 
}catch(IOException e) {throw new Exception () ;} 


判断 一 个 方法 可 能 会 出 现 异 常 的 依据 是 方法 中 是 否 有 throw 语句 。 例 如 ， 上 面 的 方法 
method70 中 的 catch 代码 块 有 throw 语句 。 如 果 调 用 了 其 他 方法 ， 其 他 方法 也 会 用 throws 子 句 
声明 抛 出 某 种 异常 。 例 如 ，method30 方 法 调用 了 method10 方 法 ， 而 在 method10 方 法 中 声明 抛 
出 IOException， 因 此 ， 在 method30 方 法 中 可 能 会 出 现 IOException. 


13.3 Java 虚拟 机 的 异常 处 理 机 制 


异常 (exception) 是 可 以 被 硬件 或 软件 检测 到 的 要 求 进行 特殊 处 理 的 异常 事件 。 异常 处 理 作为 
程序 设计 语言 的 组 成 部 分 ， 为 开发 可 靠 性 软件 系统 提供 了 强 有 力 的 支持 。Java 作为 一 种 优秀 的 
程序 设计 语言 不 仅 具 有 面向 对 象 、 并 发 、 平 台中 立 等 特点 ， 同 时 也 定义 了 灵活 的 异常 处 理 机 制 ， 
Java 虚拟 机 就 是 这 一 机 制 的 具体 实施 者 。 异常 处 理 作为 现代 程序 设计 语言 的 特点 已 被 广泛 采纳 ， 
它 提高 了 程序 运行 的 可 靠 性 。 但 由 于 Java 语言 的 特点 ， 异 常 处 理 也 带 来 了 不 小 的 麻烦 。 这 主要 
体现 在 及 时 编译 的 情况 下 ， 异 常 处 理 的 实现 较为 复杂 。 更 重要 的 一 点 是 由 于 字 节 码 编译 与 及 时 
编译 是 两 个 独立 的 过 程 ， 因 此 使 及 时 编译 的 优化 设计 受到 限制 ， 当 机 器 指令 生成 后 ， 方 法 内 代 
码 的 优化 必然 涉及 到 字 节 码 与 机 器 码 之 间 的 对 应 关系 的 调整 、 异 常 处 理 表 的 调整 。 在 异常 处 理 
语句 内 部 ， 机 器 代码 的 优化 更 要 慎重 ， 代 码 的 删除 和 外 提 都 可 能 会 造成 异常 处 理 范围 的 改变 。 
其 次 ， 异 常 处 理 也 降低 了 程序 的 运行 效率 ， 为 了 提高 运行 效率 有 些 及 时 编译 器 中 删除 了 数组 越 
界 检查 。 

在 本 节 将 详细 讲解 Java 的 异常 处 理 机 制 , 并 结合 国产 开放 系统 平台 COSIX 虚拟 机 异常 处 理 
的 设计 ， 深 入 探讨 在 解释 执行 和 及 时 编译 执行 两 种 不 同 的 情况 下 ， 异 常 处 理 设计 与 实现 的 关键 
技术 。 


13.3.1 Java 异常 处 理 机 制 基础 


Java 在 设计 上 与 C++ 有 许多 相同 之 处 ， 它 的 异常 处 理 机 制 基 本 上 沿袭 了 C++ 的 规则 。Java 
的 异常 处 理 语句 及 抛 出 异常 语句 与 相应 的 C++ 的 语句 完全 一 样 , 它 的 异常 处 理 也 是 静态 绑 定 的 ， 
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没 被 处 理 的 异常 是 沿 着 方法 调用 栈 向 上 传播 的 ， 异 常 处 理 完毕 后 程序 的 执行 点 转移 到 异常 处 理 
句柄 的 下 一 条 语句 。 

Java 与 C++ 不 同 的 是 Java 具有 完善 的 异常 类 定义 ，Java 的 异常 类 可 分 为 三 大 类 : Error, 一 
般 异 常 及 RuntimeException。 当 类 动态 连接 失败 或 产生 其 他 硬件 错误 时 , 虚拟 机 产生 Error 异常 ， 
一 般 的 Java 程序 不 会 产生 该 异常 ， 也 不 必 对 该 类 异常 进行 处 理 ，RuntimeException 类 的 异常 是 
虚拟 机 在 运行 时 产生 的 ， 如 算术 运算 异常 、 数 组 索引 异常 、 引 用 异常 等 。 由 于 该 类 异常 在 程序 
中 普遍 存在 ， 因 此 用 户 没 必要 对 它们 进行 检测 、 处 理 ， 编 译 程序 在 编译 时 也 不 会 去 检查 该 类 异 
常 ， 这 些 异 常 由 虚拟 机 在 运行 时 检测 并 对 其 进行 处 理 ， 通 常用 户 程序 需要 产生 并 提供 异常 处 理 
句柄 的 异常 为 一 般 异常 ， 一 般 异常 与 Errors 不 同 ， 它 不 是 严重 的 系统 异常 ， 也 不 是 在 程序 中 普 
饥 存在 的 ， 因 此 在 编译 时 编译 器 就 会 提示 用 户 提供 异常 处 理 句 柄 ， 和 否则 编译 不 会 通过 ， 例 如 IO 
异常 。 

编译 程序 为 含有 异常 处 理 语句 的 方法 生成 一 异常 处 理 表 ， 该 表 指 明了 异常 处 理 语句 产生 异 
常 的 字 节 码 范围 、 异 常 处 理 句柄 的 地 址 以 及 产生 的 异常 类 型 。 

虚拟 机 是 Java 异常 处 理 机 制 的 微观 实现 ， 当 虚拟 机 产生 异常 或 程序 执行 时 由 字 节 码 指令 
athrow 产生 异常 时 ， 异 常 处 理 程序 都 会 根据 所 产生 的 异常 类 型 及 产生 异常 的 当前 程序 点 ， 在 方 
法 异常 表 中 查找 对 应 的 异常 处 理 句 柄 ， 方 法 异常 表 给 出 了 某 一 程序 段 代码 所 产生 的 异常 类 型 及 
其 对 应 的 异常 处 理 句 柄 ， 若 查 到 对 应 的 异常 处 理 句 柄 则 执行 该 句柄 ， 执 行 完毕 后 返回 异常 处 理 
句柄 的 下 一 条 语句 ， 若 没 找到 ， 则 异常 沿 方法 调用 栈 向 上 传播 ， 将 产生 的 异常 传播 给 该 方法 的 
调用 者 。 


13.3.2 COSIX 虚拟 机 异常 处 理 的 设计 与 实现 


一 般 可 以 采用 如 下 三 种 方法 实现 异常 处 理 。 

(1) 动态 建立 异常 处 理 语句 的 数据 结构 链表 。 

Q) 使 用 静态 的 异常 处 理 表 ， 运 行 时 查找 该 表 ， 以 搜寻 异常 处 理 句柄 。 

(3) 使 用 有 两 个 返回 值 的 函数 。 

其 中 C++ 和 Ada 的 异常 处 理 使 用 了 第 1 种 方法 ， 第 2 种 方法 较 第 1 种 可 显著 提高 异常 处 理 
的 效率 ， 它 在 C++ 及 Java 中 得 到 了 应 用 。 在 该 方式 下 ， 编 译 器 为 每 一 方法 提供 异常 处 理 表 ， 由 
于 有 了 异常 处 理 表 ， 就 没有 必要 再 为 每 一 异常 处 理 语句 建立 数据 链表 . 当 异 常 产 生 时 ， 异 常 处 理 
程序 可 直接 查询 异常 表 ， 快 速 定位 异常 处 理 句 柄 ， 若 没 找到 ， 则 将 异常 传 播 给 上 层 方法 ， 在 它 
的 异常 查询 表 中 继续 查询 。 

第 3 种 方法 在 某 些 Java 虚拟 机 的 及 时 编译 设计 时 被 采用 。 该 处 理 形式 虽然 简单 ， 但 是 编译 
过 程 较为 复杂 。 由 于 方法 间 没 有 共享 方法 异常 表 ， 而 使 编译 后 的 代码 元 长 ， 该 方法 适用 于 异常 
发 生 频繁 的 程序 。 


1. 解释 执行 时 的 异常 处 理 


解释 器 的 异常 处 理 实现 较为 简单 ， 由 于 对 异常 处 理 的 编译 是 直接 针对 字 节 码 的 ， 因 此 异常 
的 查找 和 传播 都 较 及 时 编译 方便 得 多 。 

Java 编译 程序 为 有 异常 处 理 句柄 的 方法 生成 异常 处 理 表 ， 因 此 我 们 在 实现 时 可 直接 利用 这 
一 个 信息 生成 的 方法 异常 表 ， 方 法 异常 表 的 数据 结构 如 下 。 
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MexceptionTable { 
int start 一 pc;// 产 生 异 常 的 指令 起 始 范围 
int end 一 pc;// 产 生 异常 的 指令 终止 范围 
int handler 一 pc;// 异 常 处 理 句柄 指针 
Hjava 一 lang 一 Class* catch 一 type;// 异 常 类 型 
} 
当 产 生 异 常 时 ， 异 常 处 理 程序 根据 产生 该 异常 的 指令 位 置 及 其 产生 的 异常 类 型 ， 在 方法 异 
常 表 中 查找 符合 这 两 个 条 件 的 异常 处 理 句 柄 。 
Java 异常 处 理 机 制 规定 没有 处 理 的 异常 要 沿 方法 调用 栈 传播 给 上 层 调用 方法 ， 因 此 在 程序 
的 执行 时 我 们 应 建立 方法 调用 关系 链表 ， 以 实现 异常 在 方法 调用 栈 中 的 逆向 传播 。 方 法 调用 链 
表 的 数据 结构 应 能 恢复 方法 的 运行 环境 、 并 记录 方法 的 运行 状态 。 方法 调用 链表 的 数据 结构 
如 下 。 
*MethodCallList{ 
wud pe; // 该 方法 的 当前 字 节 码 指令 指针 
…ObjLock* lock; // 该 方法 所 在 对 象 的 对 象 锁 
…methods* meth; // 指 向 该 方法 在 类 中 的 位 置 
…]jmp 一 buf jbuf; // 设 置 解释 器 解释 执行 该 方法 时 的 运行 环境 
MethodCallList* prev; // 指 向 该 方法 的 上 层 调用 方法 


ove} 

当 异 常 产 生 时 , 异常 处 理 程序 根据 pc 值 及 产生 的 异常 类 型 , 在 该 方法 的 异常 处 理 表 (由 meth 
获得 ) 中 查询 对 应 的 异常 处 理 句 柄 ， 若 没 找到 则 异常 传播 给 该 方法 的 调用 者 (prev 指向 的 方法 )， 
异常 处 理 程序 进行 同样 的 查找 ， 当 找到 对 应 的 异常 处 理 句 柄 时 ， 异 常 处 理 程序 恢复 该 句柄 所 在 
方法 解释 执行 时 的 运行 环境 ， 并 将 该 方法 的 字 节 码 指令 指针 指向 异常 处 理 句柄 ， 运 行 环境 被 恢 
复 后 解释 器 执行 该 异常 处 理 句柄 ， 之 后 ， 解 释 器 继续 执行 其 下 面 的 其 他 语句 。 

我 们 一 般 用 操作 系统 提供 的 库 函 数 setjmp 及 longjmp 来 实现 运行 环境 的 保存 与 恢复 。 在 方 
法 调用 链表 数据 结构 中 ，lock 为 该 方法 所 属 对 象 的 对 象 锁 ， 若 该 方法 为 静态 方法 ， 则 lock 为 其 
所 属 类 的 类 锁 。 该 域 是 为 同步 方法 设计 的 ， 对 于 同步 方法 异常 处 理 完成 后 ， 应 释放 该 对 象 
(类 ) 锁 。 

异常 处 理 程序 在 进行 异常 处 理 时 ， 将 异常 分 为 两 大 类 ， 即 内 部 异常 与 外 部 异常 。 内 部 异常 
主要 指 虚 拟 机 在 运行 时 检测 到 的 异常 ， 主 要 包括 Error 及 RuntimeException。 例 如 虚拟 机 在 类 加 
载 时 需要 进行 类 文件 格式 的 检查 ， 若 类 文件 格式 错误 ， 虚拟 机 将 产生 ClassFormatError 异常 He 
拟 机 执行 字 节 码 指令 时 自动 对 数组 下 标 进 行 检查 ， 当 数组 范围 越界 时 ， 虚 拟 机 会 产生 
ArrayIndexOutOfBoundsException。 当 虚拟 机 检测 到 异常 时 ， 其 触发 异常 程序 的 执行 。 外 部 异常 
一 般 指 用 户 自 定义 的 异常 ， 字 节 码 指令 athrow 产生 外 部 异常 并 触发 异常 处 理 程序 的 执行 。 该 异 
常 存放 在 操作 数 栈 的 栈 顶 ， 如 果 在 当前 方法 中 找到 了 异常 处 理 句柄 ，athrow 指令 抛弃 操作 数 栈 
上 的 所 有 数据 ， 然 后 将 抛 出 的 异常 对 象 压 入 栈 ， 如 果 在 当前 方法 中 没 找到 异常 处 理 句柄 ， 则 蜡 
常 沿 方法 调用 栈 传播 ， 直 到 找到 处 理 该 异常 的 方法 。 此 时 ， 处 理 该 异常 的 方法 的 操作 数 栈 被 清 
除 ， 并 将 异常 对 象 压 入 到 这 个 空 的 操作 数 栈 ， 该 传播 过 程 中 的 其 他 方法 栈 都 将 被 抛弃 。 不 管内 
部 异常 还 是 外 部 异常 ， 异 常 处 理 句 柄 都 得 由 用 户 提供 。 

对 于 内 部 异常 ， 有 两 个 异常 是 比较 特殊 的 ， 它 们 是 NullPointerException( 空 指针 引用 )、 
ArithmeticException( 浮 点 溢出 )， 这 两 个 异常 可 由 硬件 检测 到 ， 操 作 系 统 提供 这 两 个 异常 的 中 断 
信号 ， 因 此 在 异常 初始 化 时 ， 可 由 库 函 数 signal 设置 这 两 个 异常 的 服务 程序 。 
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在 对 内 部 异常 进行 处 理 时 ， 异 常 处 理 程序 除了 查找 异常 处 理 句 柄 并 执行 该 句柄 外 ， 异 常 处 
理 程序 还 应 提供 方法 调用 过 程 的 全 部 信息 ， 该 信息 包括 方法 调用 栈 中 所 有 方法 的 当前 字 节 码 指 
令 指针 所 在 的 类 名 、 方 法 名 及 所 处 的 源 文件 行 号 。 该 过 程 同样 得 逆向 遍历 方法 调用 链表 的 全 部 
数据 单元 ， 由 方法 调用 表 数 据 结构 中 的 pc 值 在 方法 的 行 号 表 中 查找 该 pe 值 所 对 应 的 源 文件 行 
号 ， 行 号 表 内 记录 着 字 节 码 生成 时 字 节 码 指令 与 源 文件 行 号 的 对 应 关系 ， 该 表 保存 在 类 的 方法 
表 中 ， 类 名 、 方 法 名 也 可 在 方法 表 中 查 到 。 

以 上 介绍 了 解释 执行 时 异常 处 理 程序 的 设计 ， 由 于 编译 器 在 编译 程序 时 提供 了 充足 的 异常 
处 理 信息 ， 如 方法 异常 处 理 表 、 方 法 行 号 表 等 ， 使 得 异常 处 理 的 过 程 较为 简单 。 


2. 及 时 编译 执行 时 的 异常 处 理 


在 及 时 编译 异常 处 理 的 设计 上 ， 一 般 采 用 与 解释 器 的 异常 处 理 相同 的 设计 方法 。 在 解释 执 
行 时 ， 由 于 解释 器 控制 方法 的 全 部 活动 ， 包 括 栈 空间 的 分 配 ， 指 令 的 执行 ， 因 此 可 显 式 地 创建 
一 个 方法 调用 表 ( 解 释 器 创建 )， 供 异常 处 理 程序 使 用 。 但 由 于 及 时 编译 将 字 节 码 编译 成 本 地 码 ， 
方法 的 栈 空间 直接 分 配 在 线程 的 本 地 栈 中 ， 我 们 无 法 创建 一 个 显 式 的 数据 结构 去 反映 方法 调用 
关系 及 记录 方法 的 运行 状态 。 因 此 ， 要 处 理 异常 在 方法 调用 栈 中 的 传播 及 异常 句柄 的 查询 ， 必 
须 掌握 本 地 方法 栈 的 结构 及 字 节 码 与 本 地 代码 之 间 的 对 应 关系 。 

在 及 时 编译 时 ， 首 先 应 建立 字 节 码 与 机 器 码 之 间 的 对 应 关系 ， 在 编译 每 条 字 节 码 时 ， 我 们 
将 字 节 码 所 对 应 的 机 器 码 在 本 地 方法 代码 中 的 偏 移 记 录 下 来 ， 我 们 可 利用 这 个 信息 进行 方法 异 
常 处 理 表 的 翻译 ， 将 异常 处 理 表 中 字 节 码 的 指令 偏 移 蔡 换 为 对 应 的 机 器 码 的 内 存 位 置 。 同 理 
我 们 可 翻译 方法 的 行 号 表 将 源 文件 行 号 与 字 节 码 的 对 应 关系 转换 为 源 文件 行 号 同 机 器 码 之 间 的 
对 应 关系 。 下 面 的 程序 给 出 了 异常 处 理 表 的 翻译 过 程 。 

if (meth -> exception—table!-null)( // 方 法 异常 表 非 空 
for (I=0;I<meth->exception 一 able 一 len;I++) {//exception—table—len 为 异常 表 长 度 
e=&meth->exception 一 table [1] ; // 获 取 第 工 个 异常 表 
e-»start—pc-nativeOffset [e->start—pc] « (int)nativeCodeBase; 
e-»end—pc-nativeOffset [e->end—pc] + (int)nativeCodeBase; 
e-»handler—pc-nativeOffset [e->handler—pc] + (int)nativeCodeBase; 
} 

在 上 面 的 程序 中 ，nativeCodeBase 是 指针 ， 指 向 编译 后 本 地 代码 的 起 始 位 置 ，nativeOffset 
为 整 型 数组 存放 每 一 字 节 码 在 本 地 方法 代码 中 的 偏 移 。 经 转换 后 ，e->start 一 pc，e->end 一 pc， 
e->handler 一 pc 被 转换 为 对 应 字 节 码 的 本 地 码 在 内 存 中 的 地 址 。 同 理 ， 可 进行 方法 行 号 表 转 换 。 
方法 异常 表 及 行 号 表 的 转换 为 异常 处 理 提供 了 方便 ， 异 常 处 理 程序 可 直接 由 这 两 个 表 查 询 异 常 
处 理 句柄 及 异常 信息 ， 其 查询 过 程 与 解释 异常 处 理 相同 。 

及 时 编译 执行 时 ， 异 常 的 传播 处 理 较为 复杂 ， 这 需要 对 本 地 方法 栈 的 结构 有 一 个 清楚 的 认 
识 。 线 程 在 创建 时 Java 虚拟 机 为 其 分 配 一 个 固定 的 运行 空间 (可 由 用 户 指定 )， 线 程 的 一 切 活动 
所 需 的 空间 都 被 分 配 在 该 空间 中 。 对 于 及 时 编译 ， 该 空间 存放 本 地 方法 栈 ， 本 地 方法 栈 实 际 上 
就 是 传统 的 C 栈 。 要 实现 异常 在 方法 调用 栈 中 的 传播 ， 我 们 就 得 解决 如 何 确定 产生 异常 方法 栈 
的 位 置 ， 及 调用 该 方法 的 上 层 方法 的 栈 位 置 。 例 如 在 图 13-2 中 ， 给 出 了 线程 栈 空间 中 方法 栈 存 
放 的 示意 图 ， 图 13-1 的 方法 调用 过 程 为 方法 1 调用 方法 2， 方 法 2 调用 方法 3。 方 法 栈 在 线程 
空间 中 是 连续 存放 的 。 线 程 空间 也 是 一 个 连续 的 空间 ， 它 的 起 始 与 结束 地 址 分 别 存放 在 线程 背 
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景 数据 结构 中 。 
线程 栈 空间 
参数 空间 参数 空间 参数 空间 
返回 地 址 〈retpc) 返回 地 址 (retpc) 返回 地 址 (retpc) 
上 一 栈 ebp (retbp) 上 一 栈 ebp (retbp) 上 一 栈 ebp (retbp) 
ebp — > 
局 部 变量 空间 局 部 变量 空间 局 部 变量 空间 
操作 数 栈 空间 操作 数 栈 空间 操作 数 栈 空间 
临时 空间 临时 空间 临时 空间 
被 保存 的 寄存 器 被 保存 的 寄存 器 被 保存 的 寄存 器 
sp —> 
WES 〈 当 前 的 方法 方法 2 方法 1 


13-2 ”线程 栈 空间 中 方法 栈 存放 的 示意 图 


从 图 13-2 中 可 知 ， 方 法 栈 空间 的 连接 及 方法 的 当前 执行 点 分 别 是 由 方法 栈 中 的 数据 retbp 
和 retpe 建立 的 。 只 要 能 获取 这 两 个 数据 就 能 实现 异常 在 方法 中 的 传播 。 对 于 内 部 异常 ， 虚 拟 机 
直接 调用 异常 处 理 程序 执行 异常 处 理 ; 用 户 产生 的 异常 则 在 及 时 编译 器 编译 异常 产生 指令 
athrow 时 产生 调用 异常 处 理 程序 的 机 器 指令 。 异 常 处 理 程序 执行 时 ， 异 常 处 理 程序 的 方法 栈 为 
当前 栈 ， 异 常 处 理 程序 可 根据 其 第 1 个 方法 参数 的 存储 位 置 ， 减 去 8 字 节 偏 移 得 到 其 调用 者 方 
法 栈 的 基 址 指针 retbp， 第 1 个 方法 参数 的 存储 位 置 减 去 4 字 节 偏 移 得 到 调用 方法 的 返回 地 址 
retpe, retpc-1 即 为 调用 点 的 指令 地 址 ， 同 理 ， 在 调用 方法 的 retbp 处 又 可 以 得 到 该 方法 的 调用 
者 的 栈 基 址 及 返回 地 址 。 采 用 这 种 方式 可 实现 异常 在 方法 调用 栈 中 的 传播 。 因 此 ， 及 时 编译 异 
常 处 理 时 方法 调用 关系 链表 的 数据 结构 如 下 。 

MethodCallList( 
int retbp; // 上 一 方法 栈 的 基 址 指针 
int retpc; // 调 用 方法 的 返回 地 址 
h 

及 时 编译 时 异常 处 理 的 另 一 个 烦琐 的 过 程 是 如 何 确定 调用 点 指令 所 属 的 类 及 方法 。 在 以 上 
的 叙述 中 我 们 知道 ，retpc-1 为 某 方法 调用 其 子 方法 的 方法 调用 指令 地 址 ， 因 此 应 根据 该 地 址 信 
息 去 查询 方法 的 异常 处 理 表 以 获取 异常 处 理 句柄 ， 但 前 提 是 如 何 先 找到 该 方法 。 为 了 找到 地 址 
retpe-1 所 处 的 方法 ， 我 们 不 得 不 遍历 所 有 的 类 及 其 方法 ， 以 判断 该 地 址 是 否 在 某 一 方法 代码 内 . 
显然 这 一 方法 较为 费时 ， 当 然 我 们 也 可 设计 复杂 的 数据 结构 记录 指令 与 方法 的 查询 关系 以 简化 
这 一 过 程 ， 但 这 确实 没有 必要 ， 毕 竟 异 常 产生 的 次 数 很 少 ， 即 便 产 生 了 异常 ， 大 多 数 情况 下 也 
要 终止 程序 的 执行 ， 因 此 花费 在 这 方面 的 时 间 可 忽略 不 计 。 

在 确定 了 异常 如 何 传播 及 异常 处 理 句柄 如 何 查找 后 ， 下 一 步 的 任务 就 是 如 何 调用 异常 处 理 
句柄 。 在 异常 处 理 表 中 提供 的 只 是 异常 句柄 的 地 址 ， 我 们 必须 用 汇编 语言 实现 异常 处 理 句柄 的 
调用 , 调用 程序 如 下 ， 下 段 代码 遵循 的 是 汇编 调用 C 子 程序 的 规则 。 异 常 处 理 句柄 catch 的 调用 
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基本 上 与 C 函数 的 调用 相同 ， 异 常 对 象 可 看 成 是 其 方法 参数 ， 但 不 同 的 是 该 参数 并 不 被 压 入 参 
数 空间 ， 它 是 在 执行 catch 的 第 一 条 指令 时 被 压 入 指定 的 局 部 变量 空间 。 我们 在 及 时 编译 时 一 般 
都 是 以 基 址 寄存 器 的 地 址 为 基准 进行 数据 的 访问 ， 因 此 应 恢复 异常 句柄 所 属 方法 的 基 址 寄存 器 ， 
最 后 是 执行 异常 处 理 句柄 。 


movl eobj,%%eax // 异 常 对 象 引用 存 入 eax 
movl retbp, %%ebp // 恢 复 调用 者 方法 的 基 址 
jmp*handler pc // 调 用 异常 处 理 句柄 


本 节 我 们 讨论 了 及 时 编译 执行 时 异常 处 理 的 关键 技术 ， 可 以 看 出 由 于 本 地 代码 的 存在 ， 使 
得 异常 处 理 的 过 程 变 得 较为 复杂 。 


13.4 分 析 Dalvik 虚拟 机 异常 处 理 的 源码 


在 Dalvik 虚拟 机 的 源码 中 , 用 于 实现 异常 处 理 的 核心 文件 是 Exception.c。 在 本 节 的 内 容 中 ， 
将 简要 分 析 这 个 文件 的 源码 ， 讲 解 Dalvik 虚拟 机 实现 异常 处 理 的 基本 机 制 。 


13.4.1 初始 化 虚拟 机 使 用 的 异常 Java XE 


在 文件 Exception.c F, 通过 函数 dvmExceptionStartup0 初 始 化 虚拟 机 使 用 的 异常 Java 类 库 。 
其 实现 源码 如 下 。 


bool dvmExceptionStartup (void) 
{ 
gDvm.classJavaLangThrowable = 
dvmFindSystemClassNoInit ("Ljava/lang/Throwable;"); 
gDvm.classJavaLangRuntimeException - 
dvmFindSystemClassNoInit ("Ljava/lang/RuntimeException;"); 
gDvm.classJavaLangError - 
dvmFindSystemClassNoInit ("Ljava/lang/Error;"); 
gDvm.classJavaLangStackTraceElement - 
dvmFindSystemClassNoInit ("Ljava/lang/StackTraceElement;"); 
gDvm.classJavaLangStackTraceElementArray - 
dvmFindArrayClass(" [Ljava/lang/StackTraceElement;", NULL); 
if (gDvm.classJavaLangThrowable -- NULL || 
gDvm.classJavaLangStackTraceElement -- NULL || 
gDvm.classJavaLangStackTraceElementArray -- NULL) 
{ 
LOGE("Could not find one or more essential exception classes\n") ; 
return false; 
} 
/* 
* Find the constructor. Note that, unlike other saved method lookups, 
* we're using a Method* instead of a vtable offset. This is because 
* constructors don't have vtable offsets. (Also, since we're creating 
* the object in question, it's impossible for anyone to sub-class it.) 
qu 
Method* meth; 
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meth = dvmFindDirectMethodByDescriptor (gDvm.classJavaLangStackTraceElement, 
"<init>", "(Ljava/lang/String;Ljava/lang/String;Ljava/lang/String;I)V"); 
if (meth -- NULL) { 
LOGE("Unable to find constructor for StackTraceElement\n") ; 
return false; 
} 


gDvm.methJavaLangStackTraceElement init = meth; 


/* grab an offset for the stackData field */ 
gDvm.offJavaLangThrowable stackState = 
dvmFindFieldOffset (gDvm.classJavaLangThrowable, 
"stackState", "Ljava/lang/Object;"); 
if (gDvm.offJavaLangThrowable stackState < 0) { 
LOGE("Unable to find Throwable.stackState\n") ; 
return false; 
} 
/* and one for the message field, in case we want to show it */ 
gDvm.offJavaLangThrowable message = 
dvmFindFieldOffset (gDvm.classJavaLangThrowable, 
"detailMessage", "Ljava/lang/String;"); 
if (gDvm.offJavaLangThrowable message < 0) { 
LOGE("Unable to find Throwable.detailMessage\n") ; 
return false; 


) 


/* and one for the cause field, just 'cause */ 
gDvm.offJavaLangThrowable cause - 
dvmFindFieldOffset (gDvm.classJavaLangThrowable, 
"cause", "Ljava/lang/Throwable;"); 
if (gDvm.offJavaLangThrowable cause « 0) [ 
LOGE("Unable to find Throwable.cause\n") ; 
return false; 


} 


return true; 


13.4.2” 抛 出 一 个 线程 异常 


在 文件 Exception.c 中 ， 通 过 函数 dvmThrowChainedException0 创 建 一 个 抛 出 并 抛 出 一 个 异 
常 ， 在 当前 线程 ， 抛 出 的 正 是 设置 线程 的 例外 指针 。 如 果 我 们 有 一 个 坏 的 异常 层次 正在 抛 出 ， 
如 果 初 始 化 “丢失 ”， 然 后 试图 抛 出 一 个 异常 将 导致 另 一 个 例外 情况 。 严 重 的 是 通常 会 允许 “一 
连 串 ”例外 的 情况 ， 所 以 很 难 自动 检测 这 一 问题 。 因 为 这 只 发 生 在 破碎 的 系统 类 中 ， 所 以 不 可 
能 值得 花 周期 检测 。 

函数 dvmThrowChainedException0 的 实现 源码 如 下 。 


void dvmThrowChainedException(const char* exceptionDescriptor, const char* msg, 
Object* cause) 
{ 


ClassObject* excepClass; 
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e— 
LOGV("THROW '$s' msg='%s' cause=%s\n", 
exceptionDescriptor, msg, 
(cause !- NULL) ? cause-»clazz-»descriptor : "(none)"); 


if (gDvm.initializing) { 
if (++gDvm.initExceptionCount >= 2) { 
LOGE ("Too many exceptions during init (failed on '%s' '%s')\n", 
exceptionDescriptor, msg); 
dvmAbort () ; 


excepClass - dvmFindSystemClass (exceptionDescriptor); 
if (excepClass == NULL) { 


We couldn't find the exception class. The attempt to find a 
nonexistent class should have raised an exception. If no 
exception is currently raised, then we're pretty clearly unable 
to throw ANY sort of exception, and we need to pack it in. 


If we were able to throw the "class load failed" exception, 
Stick with that. Ideally we'd stuff the original exception 
into the "cause" field, but since we can't find it we can't 
do that. The exception class name should be in the "message" 
* field. 


if (!dvmCheckException(dvmThreadSelf())) { 
LOGE("FATAL: unable to throw exception (failed on '$s' '%s')\n", 
exceptionDescriptor, msg); 
dvmAbort () ; 
} 
return; 


} 


dvmThrowChainedExceptionByClass(excepClass, msg, cause); 


13.4.3 fih iR 


在 文件 Exception.c 中 ， 函 数 dvmThrowChainedExceptionByClass() 的 功能 是 ， 如 果 当 前 有 一 
个 类 的 引用 ， 则 “开始 /继续 ” 抛 出 进程 。 其 实现 源码 如 下 。 


void dvmThrowChainedExceptionByClass(ClassObject* excepClass, const char* msg, 


{ 


Object* cause) 


Thread* self = dvmThreadSelf(); 
Object* exception; 
/* make sure the exception is initialized */ 
if (!dvmIsClassInitialized(excepClass) && !dvmInitClass (excepClass)) { 
LOGE("ERROR: unable to initialize exception class '%s'\n", 
excepClass-»descriptor); 
if (strcmp(excepClass-»descriptor, "Ljava/lang/InternalError;") -- 0) 


«Q 


LES. Android 虚拟 机 


dvmAbort () ; 
dvmThrowChainedException ("Ljava/lang/InternalError;", 
"failed to init original exception class", cause); 
return; 


} 


exception = dvmAllocObject (excepClass, ALLOC DEFAULT) ; 
if (exception == NULL) { 


/* 
* We're in a lot of trouble. We might be in the process of 
* throwing an out-of-memory exception, in which case the 
* pre-allocated object will have been thrown when our object alloc 
* failed. So long as there's an exception raised, return and 
* allow the system to try to recover. If not, something is broken 
* and we need to bail out. 
5 
if (dvmCheckException (self)) 

goto bail; 


LOGE("FATAL: unable to allocate exception '$s' '%s'\n", 
excepClass-»descriptor, msg !- NULL ? msg : "(no msg)"); 
dvmAbort () ; 
} 
/* 
* 初始 化 异常 . 
m 
if (gDvm.optimizing) ( 
/* need the exception object, but can't invoke interpreted code */ 
LOGV("Skipping init of exception $s '%s'\n", 
excepClass-»descriptor, msg); 


) eise ( 
assert(excepClass -- exception-»clazz); 
if (!initException(exception, msg, cause, self)) { 
/* 


* Whoops. If we can't initialize the exception, we can't use 
* it. If there's an exception already set, the constructor 
* probably threw an OutOfMemoryError. 
E 
if (!dvmCheckException(self)) { 
/* 
* We're required to throw something, so we just 
* throw the pre-constructed internal error. 
x 
self->exception = gDvm.internalErrorObj; 
} 
goto bail; 
} 
} 


self->exception = exception; 


bail: 
dvmReleaseTrackedAlloc (exception, self); 
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13.44 抛 出 异常 名 


在 文件 Exception.c "P, HX initException0 的 功能 是 ， 使 用 虚线 形式 类 描述 符 抛 出 异常 名 ， 
并 描述 这 一 异常 的 发 生 原因 。 而 函数 dvmThrowExceptionByClassWithClassMessage0 和 函数 
dvmthrowexceptionwithmessagefromdescriptor0 类 似 , 但 是 它 采 取 的 是 一 个 类 的 对 象 , 而 不 是 一 个 
名 字 。 这 两 个 函数 的 实现 源码 如 下 。 
void dvmThrowChainedExceptionWithClassMessage (const char* exceptionDescriptor, 
const char* messageDescriptor, Object* cause) 


{ 
char* message = dvmDescriptorToDot (messageDescriptor) ; 
dvmThrowChainedException(exceptionDescriptor, message, cause); 
free (message) ; 

} 


void dvmThrowExceptionByClassWithClassMessage (ClassObject* exceptionClass, 
const char* messageDescriptor) 


{ 
char* message = dvmDescriptorToName (messageDescriptor) ; 
dvmThrowExceptionByClass (exceptionClass, message); 
free (message); 

} 


13.4.5” 找 出 异常 的 原因 


在 文件 Exception.c 中 , 函数 initException0 的 功能 是 , 使 用 构造 函数 的 方式 初始 化 一 个 异常 。 
如 果 初 始 化 异常 会 导致 男 一 个 例外 (例如 ，outofmemoryerror) 被 抛 出 ， 则 返回 一 个 错误 。 其 实现 
源码 如 下 。 


static bool initException(Object* exception, const char* msg, Object* cause, 
Thread* self) 
{ 


enum { 
kInitUnknown, 
kInitNoarg, 
kInitMsg, 
kInitMsgThrow, 
kInitThrow 
} initKind = kInitUnknown; 
Method* initMethod = NULL; 
ClassObject* excepClass = exception-»clazz; 
StringObject* msgStr - NULL; 
bool result - false; 
bool needInitCause - false; 


assert(self !- NULL); 
assert(self-»exception -- NULL); 


/* if we have a message, create a String */ 
if (msg -- NULL) 
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msgStr NULL; 


else { 


if 


* 
* 
* 
* 
* 
* 
* 
* 
* 
* 
* 
* 
* 
* 
* 
* 
* 
* 
* 
* 
* 
* 
* 
* 
* 
* 
* 
* 


* 
eu 
if 


msgStr - dvmCreateStringFromCstr(msg, ALLOC DEFAULT); 
if (msgStr == NULL) { 
LOGW("Could not allocate message string \"%s\" while " 
"throwing internal exception (%s)\n", 
msg, excepClass->descriptor) ; 
goto bail; 


(cause != NULL) { 
if (!dvmInstanceof (cause->clazz, gDvm.classJavaLangThrowable)) { 
LOGE ("Tried to init exception with cause '%s'\n", 
cause->clazz->descriptor) ; 
dvmAbort () ; 


The Throwable class has four public constructors: 

(1) Throwable () 

(2) Throwable (String message) 

(3) Throwable (String message, Throwable cause) (added in 1.4) 
(4) Throwable (Throwable cause) (added in 1.4) 


The first two are part of the original design, and most exception 
classes should support them. The third prototype was used by 
individual exceptions. e.g. ClassNotFoundException added it in 1.2. 
The general "cause" mechanism was added in 1.4. Some classes, 

such as IllegalArgumentException, initially supported the first 
two, but added the second two in a later release. 


Exceptions may be picky about how their "cause" field is initialized. 
If you call ClassNotFoundException (String), it may choose to 
initialize its "cause" field to null. Doing so prevents future 
calls to Throwable.initCause(). 


So, if "cause" is not NULL, we need to look for a constructor that 
takes a throwable. If we can't find one, we fall back on calling 
41/42 and making a separate call to initCause(). Passing a null ref 
for "message" into Throwable(String, Throwable) is allowed, but we 
prefer to use the Throwable-only version because it has different 
behavior. 


java.lang.TypeNotPresentException is a strange case -- it has #3 but 
not #2. (Some might argue that the constructor is actually not #3, 
because it doesn't take the message string as an argument, but it 
has the same effect and we can work with it here.) 


(cause == NULL) { 
if (msgStr == NULL) { 
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initMethod = dvmFindDirectMethodByDescriptor(excepClass, "<init>", "()V"); 
initKind = kInitNoarg; 
} else { 
initMethod = dvmFindDirectMethodByDescriptor(excepClass, "<init>", 
" (Ljava/lang/String;)V") ; 
if (initMethod != NULL) { 
initKind = kInitMsg; 
} else { 
/* no #2, try #3 */ 
initMethod = dvmFindDirectMethodByDescriptor(excepClass, "<init>", 
"(Ljava/lang/String;Ljava/lang/Throwable;)V") ; 
if (initMethod != NULL) 
initKind - kInitMsgThrow; 
} 
} 
} else { 
if (msgStr == NULL) { 
initMethod = dvmFindDirectMethodByDescriptor(excepClass, "<init>", 
"(Ljava/lang/Throwable;)V") ; 
if (initMethod !- NULL) { 
initKind = kInitThrow; 


} else { 
initMethod = dvmFindDirectMethodByDescriptor(excepClass, Neinitsny 
"(V"); 
initKind - kInitNoarg; 
needInitCause - true; 
} 
} else { 
initMethod = dvmFindDirectMethodByDescriptor(excepClass, "<init>", 
" (bjava/lang/String;Ljava/lang/Throwable;)V"); 
if (initMethod !- NULL) ( 
initKind - kInitMsgThrow; 
} else ( 
initMethod = dvmFindDirectMethodByDescriptor(excepClass, "<init>", 
" (bjava/lang/String;)V"); 
initKind - kInitMsg; 
needInitCause - true; 
) 
} 
) 
if (initMethod -- NULL) { 
/* 


* We can't find the desired constructor. This can happen if a 
* subclass of java/lang/Throwable doesn't define an expected 
* constructor, e.g. it doesn't provide one that takes a string 
* when a message has been provided. 
e 
LOGW("WARNING: exception class '$s' missing constructor " 
"(msg-'$s' kind=%d)\n", 
excepClass-»descriptor, msg, initKind) ; 
assert (strcmp (excepClass->descriptor, 
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"Ljava/lang/RuntimeException;") !- 0); 
dvmThrowChainedException ("Ljava/lang/RuntimeException;", 
"re-throw on exception class missing constructor", NULL); 
goto bail; 


/* 
* Call the constructor with the appropriate arguments. 
x 
JValue unused; 
switch (initKind) { 
case kInitNoarg: 
LOGVV ("+++ exc noarg (ic=%d)\n", needInitCause) ; 
dvmCallMethod(self, initMethod, exception, &unused); 
break; 
case kInitMsg: 
LOGVV ("+++ exc msg (ic=%d)\n", needInitCause); 
dvmCallMethod(self, initMethod, exception, &unused, msgStr); 
break; 
case kInitThrow: 
LOGVV ("+++ exc throw"); 
assert (!needInitCause); 
dvmCallMethod(self, initMethod, exception, &unused, cause); 
break; 
case kInitMsgThrow: 
LOGVV ("+++ exc msg+throw") ; 
assert (!needInitCause) ; 
dvmCallMethod(self, initMethod, exception, &unused, msgStr, cause); 
break; 
default: 
assert (false); 
goto bail; 


/* 

* It's possible the constructor has thrown an exception. If so, we 

* return an error and let our caller deal with it. 

a 

if (self->exception !- NULL) { 
LOGW("Exception thrown (ts) while throwing internal exception (%s)\n", 

self-»exception-»clazz-»descriptor, exception-»clazz-»descriptor); 

goto bail; 


/* 
* If this exception was caused by another exception, and we weren't 
* able to find a cause-setting constructor, set the "cause" field 
* with an explicit call. 
e 
if (needInitCause) { 
Method* initCause; 
initCause - dvmFindVirtualMethodHierByDescriptor(excepClass, "initCause", 
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" (Ljava/lang/Throwable; ) Ljava/lang/Throwable;") ; 
if (initCause !- NULL) { 
dvmCallMethod(self, initCause, exception, &unused, cause); 
if (self-»exception !- NULL) { 
/* initCause() threw an exception; return an error and 
* let the caller deal with it. 
£y] 
LOGW("Exception thrown ($s) during initCause() " 
"of internal exception ($s) Wn", 
self->exception->clazz->descriptor, 
exception->clazz->descriptor) ; 
goto bail; 
} 
} else { 
LOGW("WARNING: couldn't find initCause in '%s'\n", 
excepClass->descriptor) ; 


} 
} 
result = true; 
bail: 
dvmReleaseTrackedAlloc((Object*) msgStr, self); // NULL is ok 


return result; 


} 
13.4.6 ”清除 挂 起 的 异常 和 等 待 初始 化 的 异常 


在 文件 Exception.c 中 , 函数 dvmClearOptException0 的 功能 是 , 清除 挂 起 的 异常 和 等 待 初始 
化 的 异常 。 在 此 使 用 了 优化 和 验证 码 机 制 ， 如 果 没 有 发 运行 中 的 异常 ， 则 将 “初始 化 ”工作 设 
置 为 避免 进入 “death-spin” 模 式 。 其 实现 源码 如 下 。 


void dvmClearOptException(Thread* self) 


{ 


self-»exception = NULL; 
gDvm.initExceptionCount - 0; 


} 


13.4.7 ”包装 “现在 等 待 ”异常 的 不 同 例外 


在 文件 Exception.c 中 ， 函 数 dvmWrapException0 的 功能 是 ， 包 装 “现在 等 待 ”异常 的 不 同 
例外 。 在 此 使 用 一 个 未 经 声明 的 方法 来 检查 异常 ， 一 个 异常 (未 检查 的 ) 和 代替 挂 起 的 失败 相关 。 
其 实现 源码 如 下 。 


void dvmWrapException(const char* newExcepStr) 
{ 
Thread* self = dvmThreadSelf(); 
Object* origExcep; 
ClassObject* iteClass; 
origExcep - dvmGetException(self); 
dvmAddTrackedAlloc(origExcep, self); // don't let the GC free it 
dvmClearException (self); // clear before class lookup 
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iteClass = dvmFindSystemClass (newExcepStr) ; 
if (iteClass !- NULL) { 
Object* iteExcep; 
Method* initMethod; 
iteExcep - dvmAllocObject(iteClass, ALLOC DEFAULT); 
if (iteExcep !- NULL) [ 
initMethod = dvmFindDirectMethodByDescriptor(iteClass, "<init>", 
"(Ljava/lang/Throwable;)V") ; 
if (initMethod != NULL) { 
JValue unused; 
dvmCallMethod(self, initMethod, iteExcep, &unused, 
origExcep); 
/* if «init» succeeded, replace the old exception */ 
if (!dvmCheckException (self)) 
dvmSetException(self, iteExcep); 
} 


dvmReleaseTrackedAlloc(iteExcep, NULL) ; 


/* if initMethod doesn't exist, or failed... */ 
if (!dvmCheckException (self) ) 
dvmSetException(self, origExcep) ; 
} else { 
/* leave OutOfMemoryError pending */ 
} 


} else { 
/* leave ClassNotFoundException pending */ 
} 


assert (dvmCheckException (self) ) ; 
dvmReleaseTrackedAlloc(origExcep, self) ; 


13.4.8 输出 跟踪 当前 异常 的 错误 信息 


息 
5r 


在 文件 Exception.c 中 ,通过 函数 dvmPrintExceptionStackTrace0 输 出 跟踪 当前 异常 的 错误 信 
这 是 通过 呼叫 INI 异常 描述 实现 的 。 其 实现 源码 如 下 。 


void dvmPrintExceptionStackTrace (void) 
{ 
Thread* self = dvmThreadSelf(); 
Object* exception; 
Method* printMethod; 


exception - self-»exception; 
if (exception -- NULL) 
return; 


self-»exception - NULL; 
printMethod - dvmFindVirtualMethodHierByDescriptor (exception-»clazz, 
"printStackTrace", "()V"); 
if (printMethod !- NULL) { 
JValue unused; 
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e- 


dvmCallMethod(self, printMethod, exception, &unused); 
) eise ( 
LOGW("WARNING: could not find printStackTrace in %s\n", 
exception-»clazz-»descriptor); 
} 
if (self-»exception != NULL) { 
LOGI("NOTE: exception thrown while printing stack trace: %s\n", 
self->exception->clazz->descriptor) ; 
} 


self->exception = exception; 


13.4.9 搜索 和 当前 异常 相 匹配 的 方法 


在 文件 Exception.c 中 ， 通 过 函数 findCatchInMethod0 在 方法 列表 中 搜索 和 当前 异常 相 匹 配 
的 方法 。 其 实现 源码 如 下 。 


Static int findCatchInMethod(Thread* self, const Method* method, int relPc, 


ClassObject* excepClass) 


/* 
* Need to clear the exception before entry. Otherwise, dvmResolveClass 
* might think somebody threw an exception while it was loading a class. 
r7 

assert (!dvmCheckException (self)); 

assert (! dvnIsNativeMethod (method) ) ; 


LOGVV("findCatchInMethod %s.%s excep-$s depth=%d\n", 
method-»clazz-»descriptor, method-»name, excepClass-»descriptor, 
dvmComputeExactFrameDepth (self-»curFrame)); 


DvmDex* pDvmDex - method-»clazz-»pDvmDex; 
const DexCode* pCode = dvmGetMethodCode (method); 
DexCatchIterator iterator; 


if (dexFindCatchHandler(&iterator, pCode, relPc)) { 
for (33) { 
DexCatchHandler* handler = dexCatchIteratorNext (&iterator) ; 


if (handler == NULL) { 
break; 
} 


if (handler->typeIdx == kDexNoIndex) { 
/* catch-all */ 
LOGV("Match on catch-all block at 0x%02x in %s.%s for %s\n", 
relPc, method->clazz->descriptor, 
method-»name, excepClass->descriptor) ; 
return handler->address; 


} 


ClassObject* throwable = 
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dvmDexGetResolvedClass (pDvmDex, handler-»typeldx); 
if (throwable -- NULL) { 

/* 
TODO: this behaves badly if we run off the stack 
while trying to throw an exception. The problem is 
that, if we're in a class loaded by a class loader, 
the call to dvmResolveClass has to ask the class 
loader for help resolving any previously-unresolved 
classes. If this particular class loader hasn't 
resolved StackOverflowError, it will call into 
interpreted code, and blow up. 


We currently replace the previous exception with 
the StackOverflowError, which means they won't be 
catching it *unless* they explicitly catch 
StackOverflowError, in which case we'll be unable 
to resolve the class referred to by the "catch" 
block. 


We end up getting a huge pile of warnings if we do 
a simple synthetic test, because this method gets 
called on every stack frame up the tree, and it 
fails every time. 


This eventually bails out, effectively becoming an 
uncatchable exception, so other than the flurry of 
warnings it's not really a problem. Still, we could 
probably handle this better. 


CT 


-n 

throwable = dvmResolveClass (method-»clazz, handler-»typeIdx, 
true); 

if (throwable == NULL) ( 
/* 


* We couldn't find the exception they wanted in 

* our class files (or, perhaps, the stack blew up 

* while we were querying a class loader). Cough 

* up a warning, then move on to the next entry. 

* Keep the exception status clear. 

eil 

LOGW("Could not resolve class ref'ed in exception " 
"catch list (class index $d, exception %s)\n", 
handler->typeIdx, 
(self->exception != NULL) ? 
self->exception->clazz->descriptor : "(none)"); 

dvmClearException (self); 

continue; 


} 
//LOGD ("ADDR MATCH, check %s instanceof %s\n", 
Th excepClass->descriptor, pEntry->excepClass->descriptor) ; 
if (dvmInstanceof (excepClass, throwable)) { 
LOGV("Match on catch block at 0x%02x in %s.%s for %s\n", 


e- 
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relPc, method-»clazz-»descriptor, 
method-»name, excepClass-»descriptor); 
return handler-»address; 


} 
} 


LOGV("No matching catch block at 0x%02x in %s for %s\n", 
relPc, method->name, excepClass->descriptor) ; 
return -1; 


13.4.10 ”获取 匹配 的 捕获 块 
在 文件 Exception.c F, 通过 函数 dvmFindCatchBlock0 获 取 匹 配 的 捕获 块 。 其 实现 源码 如 下 。 


int dvmFindCatchBlock(Thread* self, int relPc, Object* exception, 


{ 


bool scanOnly, void** newFrame) 


void* fp = self->curFrame; 
int catchAddr = -1; 


assert (!dvmCheckException (self) ) ; 


while (true) { 
StackSaveArea* saveArea = SAVEAREA FROM FP(fp); 
catchAddr - findCatchInMethod(self, saveArea-»method, relPc, 
exception-»clazz); 
if (catchAddr »- 0) 
break; 


/* 


* Normally we'd check for ACC SYNCHRONIZED methods and unlock 


* them as we unroll. Dalvik uses what amount to generated 
* "finally" blocks to take care of this for us. 
Ue 


/* output method profiling info */ 
if (!scanonly) { 

TRACE METHOD UNROLL(self, saveArea->method) ; 
} 


/* 


* Move up one frame. If the next thing up is a break frame, 


* break out now so we're left unrolled to the last method frame. 
* We need to point there so we can roll up the JNI local refs 


* if this was a native method. 
E, 
assert(saveArea-»prevFrame !- NULL); 
if (dvmIsBreakFrame (saveArea-»prevFrame)) { 
if (!scanOnly) 
break; // bail with catchAddr -- 
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* We're scanning for the debugger. It needs to know if this 

* exception is going to be caught or not, and we need to figure 
* out if it will be caught *ever* not just between the current 
* position and the next break frame. We can't tell what native 
* code is going to do, so we assume it never catches exceptions. 
* 
* 


Start by finding an interpreted code frame. 


x 

fp - saveArea-»prevFrame; // this is the break frame 
saveArea = SAVEAREA FROM FP(fp); 

fp = saveArea-»prevFrame; // this may be a good one 


while (fp !- NULL) ( 
if (!dvmIsBreakFrame(fp)) { 
saveArea = SAVEAREA FROM FP(fp); 
if (!dvmIsNativeMethod (saveArea->method) ) 
break; 


} 
fp = SAVEAREA FROM FP(fp)-»prevFrame; 


NULL) 
// bail with catchAddr -- -1 


/* 

* Now fp points to the "good" frame. When the interp code 

* invoked the native code, it saved a copy of its current PC 

* into xtra.currentPc. Pull it out of there. 

Jl 

relPc - 

saveArea->xtra.currentPc - SAVEAREA FROM FP(fp)-»method-»insns; 

} eise ( 

fp = saveArea-»prevFrame; 


/* savedPc in was-current frame goes with method in now-current */ 
relPc - saveArea-»savedPc - SAVEAREA FROM FP(fp)-»method-»insns; 


} 


if (!scanOnly) 
self->curFrame = fp; 


/* 

* The class resolution in findCatchInMethod() could cause an exception. 
* Clear it to be safe. 

a 

self-»exception - NULL; 


*newFrame - fp; 
return catchAddr; 
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13.4.11 进行 堆栈 跟踪 


在 文件 Exception.c 中 ， 通 过 函数 dvmFillInStackTraceInternal0 对 已 经 进行 的 异常 进行 堆 
栈 跟 踪 。 在 许多 情况 下 这 个 过 程 不 会 被 检查 ， 这 使 它 保持 在 一 个 紧凑 状态 。 当 每 次 执行 的 时 
候 ， 会 清空 原来 的 栈 内 的 trace 信息 。 然 后 在 当前 的 调用 位 置 处 重新 建立 trace fii. BÓ 
dvmFillInStackTraceInternal0 的 实现 源码 如 下 。 


void* dvmFillInStackTraceInternal(Thread* thread, bool wantObject, int* pCount) 
{ 

ArrayObject* stackData = NULL; 

int* simpleData - NULL; 

void* fp; 

void* startFp; 

int stackDepth; 

int* intPtr; 

if (pCount !- NULL) 

*pCount - 0; 

fp - thread-»curFrame; 

assert (thread == dvmThreadSelf() || dvmIsSuspended (thread) ) ; 

/* 

* We're looking at a stack frame for code running below a Throwable 

* constructor. We want to remove the Throwable methods and the 

* superclass initializations so the user doesn't see them when they 
* read the stack dump. 
* 
* 
* 


TODO: this just scrapes off the top layers of Throwable. Might not do 
the right thing if we create an exception object or cause a VM 
* exception while in a Throwable method. 
i 
while (fp != NULL) { 
const StackSaveArea* saveArea = SAVEAREA FROM FP(fp); 
const Method* method - saveArea-»method; 
if (dvmIsBreakFrame (fp) ) 
break; 
if (!dvmInstanceof (method->clazz, gDvm.classJavaLangThrowable) ) 
break; 
//LOGD("EXCEP: ignoring %s.%s\n", 
// method->clazz->descriptor, method->name) ; 
fp = saveArea->prevFrame; 
} 
startFp = fp; 
/* 
* Compute the stack depth. 
Ju 
stackDepth = 0; 
while (fp !- NULL) { 
const StackSaveArea* saveArea - SAVEAREA FROM FP(fp); 
if (!dvmIsBreakFrame(fp)) 
stackDepth++; 
assert (fp !- saveArea->prevFrame) ; 
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fp = saveArea->prevFrame; 
} 
//LOGD("EXCEP: stack depth is %d\n", stackDepth) ; 
if (!stackDepth) 
goto bail; 
/* 
* We need to store a pointer to the Method and the program counter. 
* We have 4-byte pointers, so we use '[I'. 
Af: 
if (wantObject) { 
assert (sizeof (Method*) == 4); 
stackData = dvmAllocPrimitiveArray('I', stackDepth*2, ALLOC_DEFAULT) ; 
if (stackData == NULL) { 
assert (dvmCheckException (dvmThreadSelf ())); 
goto bail; 
} 
intPtr = (int*) stackData->contents; 
} else { 
/* array of ints; first entry is stack depth */ 
assert (sizeof (Method*) == sizeof (int)); 
simpleData = (int*) malloc(sizeof(int) * stackDepth*2) ; 
if (simpleData == NULL) 
goto bail; 
ert (pCount !- NULL); 
intPtr = simpleData; 


} 
if (pCount != NULL) 
*pCount = stackDepth; 
fp = startFp; 
while (fp != NULL) { 
const StackSaveArea* saveArea - SAVEAREA FROM FP(fp); 
const Method* method - saveArea-»method; 
if (!dvmIsBreakFrame(fp)) { 
//LOGD("EXCEP keeping %s.%s\n", method->clazz->descriptor, 
Y method-»name); 
*intPtr++ = (int) method; 
if (dvmIsNativeMethod(method)) { 
*intPtr++ = 0; /* no saved PC for native methods */ 
} else { 
assert (saveArea->xtra.currentPc >= method->insns && 
saveArea->xtra.currentPc < 
method->insns + dvmGetMethodInsnsSize (method) ) ; 
*intPtr++ = (int) (saveArea->xtra.currentPc - method->insns) ; 
} 
stackDepth--; // for verification 
} 
assert (fp != saveArea->prevFrame) ; 
fp = saveArea->prevFrame; 
} 


assert (stackDepth == 0); 


bail: 


if (wantObject) { 


第 13 章 异常 管理 


e 


dvmReleaseTrackedAlloc((Object*) stackData, dvmThreadSelf()); 
return stackData; 

) eise ( 
return simpleData; 


} 


13.4.12 ”生成 堆栈 跟踪 元 素 


函数 dvmGetStackTraceRaw0O 的 功能 是 ， 通 过 调用 原 整数 数据 编码 函数 dvmfillinstacktrace() 
生成 堆栈 跟踪 元 素 。 函 数 dvmGetStackTraceRaw0 的 实现 源码 如 下 。 


ArrayObject* dvmGetStackTraceRaw(const int* intVals, int stackDepth) 


{ 


ArrayObject* steArray = NULL; 
Object** stePtr; 
int i; 
/* init this if we haven't yet */ 
if (!dvmIsClassInitialized(gDvm.classJavaLangStackTraceElement)) 
dvmInitClass (gDvm.classJavaLangStackTraceElement) ; 
/* allocate a StackTraceElement array */ 
steArray = dvmAllocArray (gDvm.classJavaLangStackTraceElementArray, 
stackDepth, kObjectArrayRefWidth, ALLOC DEFAULT); 
if (steArray -- NULL) 
goto bail; 
stePtr = (Object**) steArray-»contents; 
/* 
* Allocate and initialize a StackTraceElement for each stack frame. 
* We use the standard constructor to configure the object. 
e 
for (i = 0; i < stackDepth; i++) { 
Object* ste; 
Method* meth; 
StringObject* className; 
StringObject* methodName; 
StringObject* fileName; 
int lineNumber, pc; 
const char* sourceFile; 
char* dotName; 
ste - dvmAllocObject (gDvm.classJavaLangStackTraceElement,ALLOC DEFAULT); 
if (ste -- NULL) 
goto bail; 
meth = (Method*) *intVals++; 
pe = *intVals++; 


if (pe == -1) // broken top frame? 
lineNumber = 0; 
else 


lineNumber = dvmLineNumFromPC(meth, pc) ; 
dotName = dvmDescriptorToDot (meth->clazz->descriptor) ; 
className = dvmCreateStringFromCstr(dotName, ALLOC DEFAULT); 
free (dotName) ; 
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methodName - dvmCreateStringFromCstr(meth-»name, ALLOC DEFAULT); 


sourceFile = dvmGetMethodSourceFile (meth) ; 
if (sourceFile !- NULL) 


fileName - dvmCreateStringFromCstr(sourceFile, ALLOC DEFAULT); 


else 
fileName - NULL; 


* 


Invoke: 


* 


* String fileName, int lineNumber) 
* (where lineNumber==-2 means "native") 
n 

JValue unused; 


dvmCallMethod(dvmThreadSelf(), gDvm.methJavaLangStackTraceElement init, 
Ste, &unused, className, methodName, fileName, lineNumber); 


dvmReleaseTrackedAlloc(ste, NULL); 


public StackTraceElement (String declaringClass, String methodName, 


dvmReleaseTrackedAlloc((Object*) className, NULL); 
dvmReleaseTrackedAlloc((Object*) methodName, NULL); 
dvmReleaseTrackedAlloc((Object*) fileName, NULL); 


if (dvmCheckException (dvmThreadSelf ())) 
goto bail; 
*stePtr++ = ste; 


} 


bail: 


dvmReleaseTrackedAlloc((Object*) steArray, NULL) ; 
return steArray; 


13.4.13 ”将 内 容 添加 到 堆栈 跟踪 日 志 


在 文件 Exception.c 中 ， 函 数 dvmLogRawStackTrace0 的 功能 是 ， 将 获取 的 异常 信息 内 容 添 


加 到 堆栈 跟踪 日 志 中 。 函 数 dvmLogRawStackTrace0 的 实现 源码 如 下 。 
void dvmLogRawStackTrace(const int* intVals, int stackDepth) 


{ 


int i; 
/* 
* Run through the array of stack frame data. 
F 
for (i = 0; i < stackDepth; i++) { 
Method* meth; 
int lineNumber, pc; 
const char* sourceFile; 
char* dotName; 
meth = (Method*) *intVals++; 
pe = *intVals++; 


if (pe == -1) // broken top frame? 
lineNumber = 0; 
else 


lineNumber = dvmLineNumFromPC(meth, pc) ; 


// probably don't need to do this, but it looks 


nicer 
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dotName - dvmDescriptorToDot (meth-»clazz-»descriptor); 
if (dvmIsNativeMethod(meth)) { 
LOGI("\tat %s.%s(Native Method)\n", dotName, meth-»name); 
) eise ( 
LOGI("\tat $s.$s($s:$d) Wn", 
dotName, meth-»name, dvmGetMethodSourceFile (meth), 
dvmLineNumFromPC (meth, pc)); 
} 
free (dotName) ; 
sourceFile = dvmGetMethodSourceFile (meth) ; 


13.4.14 ”打印 输出 为 堆栈 跟踪 信息 
在 文件 Exception.c 中 ， 函 数 logStackTraceOf0 的 功能 是 ， 将 异常 日 志 信 息 直 接 打印 输出 为 
堆栈 跟踪 信息 。 函 数 logStackTraceOfO 的 实现 源码 如 下 。 


static void logStackTraceOf (Object* exception) 


{ 


const ArrayObject* stackData; 
StringObject* messageStr; 
int stackSize; 

const int* intVals; 


messageStr - (StringObject*) dvmGetFieldObject (exception, 
gDvm.offJavaLangThrowable message); 

if (messageStr !- NULL) { 
char* cp = dvmCreateCstrFromString (messageStr); 
LOGI("$s: %s\n", exception-»clazz-»descriptor, cp); 
free(cp); 

} else ( 
LOGI("%s:\n", exception->clazz->descriptor) ; 

} 


stackData = (const ArrayObject*) dvmGetFieldObject (exception, 
gDvm.offJavaLangThrowable stackState); 
if (stackData == NULL) { 


LOGI(" (no stack trace data found) \n"); 
return; 

} 

stackSize = stackData->length / 2; 


intVals = (const int*) stackData->contents; 


dvmLogRawStackTrace(intVals, stackSize) ; 


«Q 


